タグ

statisticsに関するlakehillのブックマーク (97)

  • 母数とはなにか

    はじめに 「母数とは」で検索すると以下のような記事が出てきます。 母数の意味 - 数学 - 教えて!goo (現時点では google 検索で上から3番目) 分母と母数の違いを教えてください。 - livedoor ナレッジ (4 番目) これらの「ベストアンサー」にはまちがいが書いてあります。 どうやら「『母数と分母はちがう!』という話はどこかで聞いたことがあるけど、けっきょく『母数ってなんなのか』がよくわからないので、やはり微妙に間違った知識だけが頭に残ってしまった」という人がけっこういるようです。 そうなってくると、単に 「母数」を「分母」の意味で使うのはやめろ と言っただけでは無責任なのかもしれません。 そこでちょっとぼくなりに「母数」を説明してみます。 とりあえず 「母数」は「分母の数」や「全数」とは、まったく別ものだと思ってください。母数はパラメーター(parametor)の訳

    母数とはなにか
  • ダメな統計学:目次|Colorless Green Ideas

    2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』に大幅に加筆したものだ。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を参照されたい。 はじめに データ分析入門 検定力と検定力の足りない統計 擬似反復:データを賢く選べ p値と基準率の誤り 有意であるかないかの違いが有意差でない場合 停止規則と

    ダメな統計学:目次|Colorless Green Ideas
  • 「センター国語は得点分布が綺麗だった→平均点が低いのは受験者の学力不足」!?

    手塚一佳 DFA/博士(芸術) MENSAN @tezukakaz センター試験の正規分布曲線が綺麗だったことを指して問題の質が高いと言ったら、受験生が「その根拠は」と一言レスで聞いてきた。正規分布の意味も理解していないのに呆れたが、そもそもその根拠のない自信は一体どこから湧いて出てくるのかとても不思議であった。大丈夫かニッポン? 2014-01-25 22:51:18

    「センター国語は得点分布が綺麗だった→平均点が低いのは受験者の学力不足」!?
  • Rの初歩

    Rのインストール R(アール)は統計・データ解析・統計グラフ作成のためのオープンソースソフトです。CRAN(「シーラン」または「クラン」、Comprehensive R Archive Network)のミラーサイト(例えば https://cloud.r-project.org など)からダウンロードし、インストールしてください。Windows用、Mac用、Linux用があります。 最近では下図のような RStudio(アール・スタジオ、英語の発音により忠実に書けばアール・ステューディオまたはアール・ストゥーディオ)という統合開発環境(IDE)を介してRを使う人が増えています。Download RStudio Desktop のページからダウンロードしてインストールします。 RStudio。左上ペインがソースエディタ(この図では隠れている)、左下がRコンソール、右上がグローバル環境のオブ

  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
  • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

    ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.
  • WORLD HEALTH RANKINGS

    COUNTRY HEALTH PROFILES Click On Map Or Use Scroll To Choose Country

    WORLD HEALTH RANKINGS
  • なぜ日本人の3人に1人は「自力で生活できない人を政府が助ける責任はない」と考えるのか - あままこのブログ

    去年の話になりますが、ある統計を元にした2つの記事が注目されたことがありました。 Afternoon Cafe 日貧困対策がどれほど貧困かよく分かる数字(BLOGOS版) 自力で生きていけない人たちを国や政府は助けるべきだとは思わないと言う人が日では三人に一人以上もいることがアンケートでわかりました。 日 38% アメリカ 28% イギリス 8% フランス 8% ドイツ 7% 中国 9% インド 8% 日はなんという生きにくい国なのでしょうか。 「人様に迷惑をかけるな」という日的な美徳は、度が過ぎれば他人に冷酷であることの裏返しでもあります。(中略)こういう冷酷な国民性だから生活保護をサディスティックに攻撃する政治になるのか、それともこういう政治だから人々の心がささくれ立って冷酷になってしまうのか、卵が先か鶏が先かですが、どこかでこの閉じたスパイラルを断ち切らねばいけませんね。

    なぜ日本人の3人に1人は「自力で生活できない人を政府が助ける責任はない」と考えるのか - あままこのブログ
    lakehill
    lakehill 2013/02/23
    いろいろ調査データがあって興味深い
  • はてなブログ | 無料ブログを作成しよう

    カブを後輩に譲った話 僕がはてなブログを始めて最初の記事がこれ。当時は大阪に暮らしていたので大阪生活という名前でブログをやっていた。現在は社宅に居るから社宅生活。引っ越したらまた次のブログに引っ越すよ。 ジムに通っていた頃には週4以上で乗っていたけれど、最近忙しくてここ一…

    はてなブログ | 無料ブログを作成しよう
  • 増田ははてなが若い女性に大人気のサイトだとでも思ってるんだろうか? - 情報の海の漂流者

    はてなの支持率調査で日共産党が50%以上の驚愕の偏り ヒント1 はてな人力検索のアンケートは回答することでポイントが貰える ヒント2 当時、はてな人力検索を化粧品等のマーケティングに使っていた会社があった(関東+若い女性だと回答できるアンケートが増える) ヒント3 一時期、アンケート回答者の中にお小遣い稼ぎbotや質問文を読まない人が混じっている可能性が指摘されていた という知識をもっておくと幸せになれるかもね。 (ちなみに、「人力検索で◯◯という製品を使ったことがある人にお聞きします」系のアンケートを取ると、どの商品もほぼ同じペースで回答が付く 人気商品とマイナー商品の使用経験者が同じ人数のはずはないのだが……) 問題のアンケートのクロス分析 共産党女性に大人気!? 全100人の回答者の中で共産党を支持している女性は34人 20代の75%以上が共産党に投票!? 全100人の回答者の中で

    増田ははてなが若い女性に大人気のサイトだとでも思ってるんだろうか? - 情報の海の漂流者
  • SYNODOS JOURNAL : 高校理科の授業スタイルの国際比較 舞田敏彦

    2012/10/309:0 高校理科の授業スタイルの国際比較 舞田敏彦 OECDが3年間隔で実施している国際学力調査のPISAをご存知だろうか。そう。読解力の国際順位が何位、科学的リテラシーが何位というように、各国の教育関係者を一喜一憂させるアレである。しかるに、この調査は学力調査だけから成るのではない。生徒質問紙調査や学校質問紙調査も含んでおり、そこには、各国の生徒の家庭環境や学校生活の様相を把握するための設問が盛られている。 ありがたいことに、OECDホームページにて、回答結果が入力された段階のローデータ(未加工データ)をダウンロードし、自分の関心に即した自前の分析を行うことも可能である。しかしながら、この恩恵が十分に活かされているとは言い難く、何とも勿体ないことである。この場において、PISA調査のローデータを使えばこういうことができるという、一つの事例をご覧に入れようと思う。  ■

    lakehill
    lakehill 2012/10/30
    日本が「統計大国」だということは知らなかった
  • 中心極限定理 - Wikipedia

    ノート:中心極限定理#2024年9月5日 (木) 11:22の編集についてに、このページに関する議論があります。(2024年12月) 議論の要約:中心極限定理の書き換えとその理解について この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "中心極限定理" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2010年2月) サイコロを n 回振ったときの出た目の和 Sn = X1 + … + Xn の分布が n を大きくするに従って正規分布による近似に近づく様子 中心極限定理(ちゅうしんきょくげんていり、英: central limit theorem, CLT)は、確率論・統計学における極

    中心極限定理 - Wikipedia
  • ジップの法則 - Wikipedia

    ウィキペディア(30ヶ国語版)における単語の出現頻度 ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して 1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。 包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はゼータ分布(英語版)の特殊な形である。 この法則はアメリカ言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究としてFelix Auerbach(英語版)、Jean-Baptiste Estoup(フランス語版)などの研究があり、ジップ自身もそのことを1942年

    ジップの法則 - Wikipedia
  • 「喫煙率が下がると肺がん死が増える」のはなぜか? - NATROMのブログ

    武田邦彦氏が、「どうも何かを間違っているような気がします」という保留付きながら、「タバコを吸わない人に対して、タバコを吸うと肺がんの死亡率は10倍以上減る」という推論をしていました。 ■武田邦彦 (中部大学): 奇っ怪な結果?? タバコを吸うと肺がんが減る?! でも、なにか釈然としなかったので、1955年頃から1985年頃までの統計的データから、「タバコを吸うと何倍ぐらい肺がん(気管、気管支を含む)になりやすいのか?」という計算をしてみました。基礎となるデータは厚労省やがんセンターなどから出ている男性のものを使い(下の図。データ自体は誰も異議がないと思います)、次の前提を起きました。 1) タバコの害は継続的に20年ぐらい吸った人が、さらに20年ぐらい後に肺がんになる(そのために1985年以後の喫煙率のデータは使えません。1985年の20年後は2005年になり、それ以後はデータがまだ無いか

    「喫煙率が下がると肺がん死が増える」のはなぜか? - NATROMのブログ
  • 統計局ホームページ/日本の統計 2025-第2章 人口・世帯

    〒162-8668 東京都新宿区若松町19番1号 電話 03-5273-2020(代表) ©1996 総務省(法人番号2000012020001)統計局 所在地・交通案内 サイトの利用について

  • 合計特殊出生率は、どのように計算するのですか - 埼玉県ホームページ

  • 渡邊芳之先生@ ynabe39の「「そういう発想法自体が数学リテラシーのなさなのだ」というならそうかもしれないね。」 - Togetter

    たぶんこういう質問に「確実に正しいのはこれだけだ」と即答できるのが「数学の人の思考」なのだと思う。いっぽう「われわれ」は各選択肢について「実際のデータではどうなるかなあ」と考えてしまう。「そういう発想法自体が数学リテラシーのなさなのだ」というならそうかもしれないね。by 渡邊芳之

    渡邊芳之先生@ ynabe39の「「そういう発想法自体が数学リテラシーのなさなのだ」というならそうかもしれないね。」 - Togetter
  • コホート研究、ケースコントロール(症例対象研究)

    コホート研究とケースコントロール(症例対照研究) 臨床で行われる研究には、実際の患者に参加してもらって試験する「臨床試験」や検査データや血液サンプルの提供を受ける「観察研究」などがある。臨床試験の代表的なものには、コホート研究やケースコントロールがある。 臨床試験は「前向きか後ろ向きか」でも分けることができ、コホート研究は前向きの研究でケースコントロールは後ろ向き研究に分類される。前向き、後ろ向きの違いは未来へ向かって調べるか、過去へ向かって調べるかの違いである。 前向き:未来へ向かって調べる(ex.コホート研究) 後ろ向き:過去へ向かって調べる(ex.ケースコントロール) ・コホート研究の例 ガンと喫煙の関係性を調べたい。40~50歳の無造作に選んだ男性1000人にアンケートを取り、今までに喫煙をしたことがあるかどうかを聞いた。その後の10年間において、何らかのガンが発生したかを調査した

  • EarthTrends: GDP: Percent GDP from manufacturing