RSSフィード:http://alpha-ralpha.com/diary/index.rdf
2024-06-23 [長年日記]
_ [統計学] 政府統計。
e-Statsというページでは国勢調査はじめさまざまな政府統計データにアクセスできる、ということを最近知った。『公的統計による統計入門』という本がとても使い方の参考になる。この本はそればかりではなく、色々なグラフの描き方を紹介しており、探索的データ解析の参考とも捉えることができるのだ。本にも載ってる辺りのデータに直接アクセスしてコロナ感染拡大の生活様式への影響を見ることなんかもできる。少しずつこのデータベースの使い方がわかってきたので、実際にデータをダウンロードして得意のRで有意差を検定したらおもしろかろう、などと思ったのだが、それはちょっと甘かった。国勢調査は5年毎だし、毎年の調査項目だって多分携わるお役人がどんどん変わっていくからだろう、ファイルの名付け方にいまいち過去との連続性が無い。そして実際に統計表を開いてみれば、こりはびっくり。表としての見てくれを気にしてだろう、要らない空白があったりとか数値をカッコでくくってみたりとか。ネ申エクセルって、こんなところに堂々とまだ生き残ってたのね。河野太郎ちゃんが「こんなのやめようよ」って当時のツイッターで呟いたのは2016年。もしかしたらそこからの間にエクセルデータのデータ・クレンジング技術も長足の進歩を遂げてるのかもしれないな。ちょっと調べてみるかな。という訳で、趣味の統計は今宵もおもしろかった。「趣味の○○」と称する道には、こういった「奥が深い症候群」を誘発する罠がどの道にもたくさん仕込まれているんだ。だから楽しい、と考えるしか無い。楽しいと思えるのは僕がホモ・ルーデンスの1人だからだと思う。そんなこと書いてるけど僕はまだ『ホモ・ルーデンス』を読んでない。奥が深いことだのう。ほい、じんが!