はてなキーワード: 帰無仮説とは
事前に設定した有意水準のもと、帰無仮説を棄却するだけの差があるならたとえそれがギリギリ棄却となるような低い相関係数であっても仮説検定としては何も問題はない。仮説検定というのは棄却するかどうかという定性的なものであって、小さなp値で棄却できた方が頑健な結果というような解釈が出来る定量的なものではない。仮説検定で有意という結果が得られた後にやって意味がある定量的な分析は、効果量がどれくらいかを見ること。具体的には各メディア情報への信頼指数が1σ変化することに対応する斎藤氏への評価の変化幅はどれくらいかといった分析。これは相関係数が低くても大きなものになり得るし、その逆もあり得る。相関係数は線形度合いを見ているだけだから、各メディア情報への信頼指数が1σ変化することに対応する斎藤氏への評価の変化幅が全て2倍になったり半分になってもほぼ変わらない。つまり、相関係数では効果量は測れない。当然、相関係数が小さく見えるといったことも分析上の問題にはならない。繰り返しになるが、仮説検定は帰無仮説を棄却するかどうかが全てであって、より大きな相関係数で棄却出来ればより頑健な結果が得られたといったような評価を出来るものではない。
私はExcelおじさんだ。
往々にそうであるように、ちょっとした好意と、悪ノリだったと思う。
個人が勝手に作ったツールなんか、存在しないほうがいいと思う。
しかし、私が作らなくてもだれかが作るんだと思う。
あるいは、誰も作らずにExcel音痴たちが延々と苦しむかで、便利なシステムが導入されることはないと思う。
ChatGPTによってとってかわられるかと言えば、たぶんそうはならない。
Excel音痴たちは、データを整理できないのかわかってないし、そもそもどうしたいかを分かってないからだ。
要件定義ができないんだから、外部に作ってもらうことも、AIに頼ることも無理だ。
糞みたいな仕事
私は、統計解析おじさんでもある。
これも、なんでそうなったのかわからない。
「統計的に有意であった」とか「統計的に有意ではなかった」みたいな錦の御旗がほしいという悩みに答えて、データをこねくり回す。
統計的に有意であったとかそうでかったかなど、帰無仮説の立て方次第だとコミュニケーションを取ろうと努力するが、「結局どうなの?」
と、私の今までの説明を全く理解してない質問が飛んできて、頭を悩ませるのだが、可能な限り、欲しい答えに近い回答が出るように結果を返す。改ざんじゃないし嘘ではないけれど、ペテンだ。
やめたほうがいい。
AIに代わってもらえないかと期待するが、たぶんAIは、本人もなにが言いたいのかなにがしたいのかわからない問題に解答はしてくれないだろう。
弊社、分析機器は機器が吐き出すデータを専用ソフトで解析してレポートをするようなものが多い。
で、メーカーが潰れたり、製品が廃盤になったりして、ソフトが更新されず、x64 では使えないみたいな糞なことがしばしば起きる。
しらない拡張子でも、たいがいは中身はzipで、csvやバイナリーファイルの詰め合わせで、そこから専用ソフトと同じ数字が出るようにアルゴリズムをリバースエンジニアリングする。AIのおかげでコーディングが楽だ。でも、たぶん私以外にできない仕事だ。
しかし、これも、やめたほうがいい。なんで、メーカー非公式のアプリを作って、私個人が契約してるサーバーにデプロイして、みな会社のデータを無断でアップロードして分析するのか。アウトだろう。
メールに添付ファイルでExcelのファイルのアンケートが送りつけられ、そこに書き込んで返信して、それを集計するというアンケートが取られたりする。かなり偉い、役員クラスが一斉メールで数百人にメールして、それを集計したりするから頭が下がる。
だれもが、タイプライターの代わりにしかパソコンを使えない変な会社なので、私みたいな、40代にもなって部下なしの平社員がこんなことをしてる。コンプラ的にも長期的にもよくないし、人事評価という意味でも評価されない。
偉い人はExcelも統計処理もアプリも理解できないので、どれだけ便利なのかもわかってない。
マイナスにもならない。コンプラ的にどう問題なのかも偉い人は理解できない。
Chat GPTがいくら賢かろうと、偉い人たちは、報告書の言葉尻にケチをつけたり、パワポのフォントに口を出したり、Excelのセルを結合したりするのが仕事だと思って邁進し続けるんだろう。
最近、私は無能の烙印が押され、本業が干されているので、こういう糞みたいな雑用が増えてる。
PythonやVBAを操ったところで、それでIT関連に転職できるはずがない。40代未経験で雇ってもらえというのか。
RもPythonも、身内の統計解析をどんだけしたところで、これが職歴として評価される見向きもされないだろう。
医療系ならSASでも使わなきゃ、ビジネス系ならtableauとかSPSSを実務で使わなきゃ話にならない。
簿記や会計の知識が必要であったり、サーバーにデータベースを構築したりしたって、誰が評価してくれるというのだ。
まあ、仕事はやめるんだけど。
反リベラル、反フェミニストのバカさにほんと呆れ果てるな。大学行ってからネットやった方いい
アイツら小卒しかおらんやろ
大体「私は100%の事実であるという自然科学的証明がなくてもほぼ全世界で疑いようがなく帰無仮説を棄却できるとして扱われること」の意味がわかりません。私には分からないので、批判します(?)
とか、
とか、
文字や出来事の解釈は完全に自由で、個人それぞれの考え方に依るだけのものであり、そこに妥当な解釈や法則性などは存在しません
もう倫理や哲学や社会学で議論され尽くしてる内容だとしても、私が知らないから、存在しません
そんなんしか言ってないんだよな
道具の使い方とは何かという話である。
ChatGPTは想像とは異なる仮説を作って最初にぶん投げるとよい。増田なら帰無仮説は得意のはず(偏見)
掛け算の交換法則について教えてください
掛け算の交換法則とは、数の掛け算において、数の順序を変えても掛け算の結果が変わらないという法則です。具体的には、任意の実数aとbに対して、以下の式が成り立ちます。
a×b =b×a
...
掛け算の交換法則は、算数や数学の基本的な計算において非常に役立ちます。これを知っていることで、計算がシンプルになったり、計算の手順を変更できることがあります。
では、かけ算の順序には意味がありますか?
掛け算自体の結果には順序が影響を与えないため(交換法則により)、数値のみを単純に掛け合わせる場合、順序に意味はありません。
しかし、数学や実世界の問題の文脈においては、順序が意味を持つことがあります。
ベクトルにおいては、外積(またはクロス積)の順序は重要です。ベクトル a と b に対して、a × b と b×a は方向が逆のベクトルになります。
2. 行列の掛け算:
行列の乗算では、掛ける順序が非常に重要です。2つの行列 A と B に対して、AB と BA は一般的に異なる結果をもたらします。
3. 実世界の状況:
例えば、ある商品の元の価格に対して10%の割引を受けた後に8%の消費税がかかる場合と、消費税をかけた後に10%の割引を受ける場合では、最終的な価格が異なります。このような状況では、計算の順序が結果に影響を与えます。
これらの例を考慮すると、数値だけの単純な掛け算では順序は意味を持たないものの、特定の文脈や状況においては掛け算の順序が重要となることがあります。
前半("トリチウムの話も含めてあらゆる科学理論は証明されておらず、すべての理論は仮説だと言えるよ。"まで)は正しい。
反証という日本語は正しくないので帰無仮説と呼ぶ。帰無仮説になる「安全であるない」は一般に状況証拠の積み上げで否定する。
ある集団が健康被害を訴えた。彼らの共通点は処理水を放出した海域で泳いでいたあるいは海域で捕獲された魚を食していた。彼らは内部被ばくをしていた。彼らの体内の三重水素の比率が、そうでない人の体内の三重水素の比率に比べて有意に多い。
これは直接的に海洋放出が健康被害の原因であることを示すものではない、いわゆる状況証拠であるがこれでよい。
「安全である」は「安全でない」を統計的に否定したものなので、帰無仮説成立の可能性を有意水準の範囲で否定できなくなった時点で「安全である」とは言えなくなる。
そうやって今までの四大公害や食中毒や得体のしれないものの原因を突き止めてきた。最近では沖縄米軍基地や横田基地のPFASが記憶に新しい。
海域モニタリングも同じ話。現在多くの国が原発処理水を放出し続けている中で
今後のモニタリングで異常値の原因なんか特定できるはずもない。
仮に今後異常値が出たとして、「処理水放出が原因とは断定できない」というしかないんじゃないかな。
(冒頭で正しいと書いた)前半部分では一般的な方法論を述べているにも関わらず、ここにきてケース固有の現実の技術水準の話にすりかえている。
特に海域モニタリングについては、主観の域を全く出ていない。異常値が出たら放出口近辺を調べることによって放出が原因か否かを科学的(確率的・統計的)に判断することができる。
危険の判定を下すことは十分に可能(否定の根拠が増田の主観でしかない)なのでこれ以降は語る必要がないのだが、以下については論理に飛躍があり過ぎるので一つずつ潰しておく。
処理水放出が危険だったという判定を下す、つまり反証をできないのであれば、反証に繋がりそうな事例を否定するに終止するしない。
反証可能性は否定できていないので事例を否定するに終始する必要はないし、むしろ被害者救済を担う国は早く見つけたいだろう。
「処理水放出は安全である」という主張は、そもそも確率的/統計的なもので絶対ではない。科学とはそういうもの。
従って、健康被害が発生した場合は政府として何が原因なのかは当然調査することになる。システムのフェールなのかそもそも構造的にトリチウムで健康被害が生じないというのが誤りだったのか。ただし、ことトリチウムに限って言えば実績が十分にあり過ぎるので、否定されることは考えにくいが(もちろん絶対ではない)。
①処理水放出は科学理論だよ。主張する当の日本政府がそう言ってるよ。
①言いたいことはわかるが正しい日本語を使いましょう。処理水放出=科学理論って何ですか?
③状況証拠の積み上げだよ。工学に数学のような厳密な証明は必要ないし一般にできるとは限らないから詳細なメカニズムの解明は後で十分だよ。その状況証拠を統計的に否定する責任は東電と政府にあるので第三者は詳細メカニズムの解明までする必要はないよ。
まともに統計学も扱えず、思考停止でp値を計算してるだけの心理学だの社会科学だのの論文が大量にあるんだよ。
こういう感じ https://www.jstage.jst.go.jp/article/sjpr/59/1/59_84/_pdf
だいたいさあ、p値計算してるってことは統計的検定をしてるってことなわけだけど、そのほとんどが帰無仮説が点仮説なんだよ。思考停止で「差がない」という点仮説を置いてるわけ。
おめーの扱ってるその複雑な事象がほんとうに点の仮説を棄却するだけで支持されると思ってんのか???って話なんだけど、アホは何も考えずにソフトに計算させてp値が小さい!やった!とかやってるわけ。
さらにどうしようもないアホはp値が小さくなるまで実験を繰り返すとかやってたりするしな。お前はその目の前の統計的検定が確率的現象を前提としてることの意味を分かってんのかと。
あら、また捨て台詞で逃亡ですか?
社会的なものである以上は100%を定義することができないから可能性という言葉で表現されているだけでその実は帰無仮説を棄却できる程度の可能性ですからほぼ確実と同視しているものですよ
そうでなければ犯罪心理学の本で性犯罪について「女性蔑視の社会的雰囲気が契機になった」などと書かれないでしょう
女性蔑視を含んだ表現物が社会に女性蔑視をもたらすか、人権を侵害する結果に繋がる可能性があるかについて、もたらさないとする蓋然性に繋がる事象、もたらすとする蓋然性に繋がる事象を比較し、逆にもたらさないとする仮説が帰無仮説を棄却できますか?
親切にももう一度言うが、お前が書いたこれ、「萌え絵は女性蔑視である」あるいは「萌え絵は女性蔑視を助長する」の論拠に、全くなってないぞ。
社会的なものである以上は100%を定義することができないから可能性という言葉で表現されているだけでその実は帰無仮説を棄却できる程度の可能性の心証ですからほぼ確実と同視しているものですよ
そうでなければ犯罪心理学の本で性犯罪について「女性蔑視の社会的雰囲気が契機になった」などと書かれないでしょう(複数犯罪者の自白、これは下記で言う後者に当たりますね。)
女性蔑視を含んだ表現物が社会に女性蔑視をもたらすか、人権を侵害する結果に繋がる可能性があるかについて、もたらさないとする蓋然性に繋がる事象、もたらすとする蓋然性に繋がる事象を提示してくれないと。反論するならもたらさないとする仮説が帰無仮説を棄却できる確証を得られますか?
頭の悪い人がこんなに騒いで気持ち悪いですね
有意な差がないときの正しい解釈らしいけどしっくり来ないんだよなあ。
高校で習った集合の図で、たとえば画用紙に一つだけ円描いてその円の内側を「ある」と定義したらその補集合に当たる円の外側の余白は全て「ない」を表すよね。
「あるとはいえない」という集合が現れる余地がない気がするんだけどどこにあるんだろう?円周上とか?
そもそも帰無仮説や対立仮説を論じるときに前提としてる集合の構造には「ある」「あるとは言えない」「ない」の三つがちゃんと想定されているのか?
「ある」「あるとは言えない」だけで成り立ってる世界なのかもしれないし。でもそれは図ではどのように表されるものだろう。もやもやする。
座学よりさきに、別の実習で
たぶん、まだ統計の授業とかまだだと思うけど、冊子読めばわかるから」
ってなノリ。
「ユウイサケンテイ?何じゃそれ?対照群と明らかに数字違うのに、なんの儀式よ?」
さっぱりわからなかった。
大学ってのは、高校と違って数字が出てくる実験をやるとこういう儀式が必要なのかと思った記憶しかない。
今思うと、あの実験データに対して本当にt検定を使うのが正しかったのかも怪しい。
そうこうして、1年の後期だったか2年次だったか、統計の授業を受講する。
気持ち悪い積分記号がたくさんだけど、ふんわり式の意味さえ理解しとけば方程式みたいに解かなくてよいらしい。
教科書の式に四則の計算をして、数表に当てはめればいいなら苦じゃなかった。
帰無仮説と対立仮説を立てるっていう基本をすっとばし、とりあえずテストの点さえとれればいいと思って適当にパスしたせいか、まったく身にならなかった。
「なんかよくわからんから全部t検定じゃダメ?等分散が仮定できるかどうかとかようわからん。F検定すりゃいいの?もう全部ウェルチでよくね?」
『実験計画と分散分析のはなし―効率よい計画とデータ解析のコツ』大村平
読んでるうちに
ってなってきて、今までぜんぜんわかってなかったことを知る。
仮説検定警察です。
仮説検定では、「平等ではない」または「平等ではないとは言えない」ということしかわかりません。統計の基本ですね。
まず帰無仮説を立てます。この場合は「男女差別はない」となります。そして統計の数字を検証します。ここでp値などの道具が登場するわけですが、数字差が大きい時にわかるのは「男女差別はない」という帰無仮説を否定するだけの証拠がある、つまり「男女差別はある」ということです。
反対に数字差が十分大きくないときには「帰無仮説を否定できない」つまり「男女差別がないという仮説を却下できるだけの情報がない」言い換えると「よくわからない」です。
それから、帰無仮説の置き方によっても変わってきます。「男女差別はない」「男女平等ではない」のどちらを仮説として採用するのかはかなり検討する必要があります。仮説検定はやり方によってどうとでも好きな結果を出しやすいので、元増田のような使い方をする人は要注意です。
詳しくはこの記事を参照。 「“統計的に有意差なし”もうやめませんか」 Natureに科学者800人超が署名して投稿 https://www.itmedia.co.jp/news/articles/1903/26/news112.html
彼女を呼んだ東大を評価するのはわかる。祝辞の論旨もわかる。けれども全文を読むと、納得感よりもむしろ反感のほうが上回ってしまう。リアルタイムで聞いていたらよりそう思っただろう。
「ちなみに東京大学理科3類は1.03、平均よりは低いですが1.0よりは高い、この数字をどう読み解けばよいでしょうか。統計は大事です、それをもとに考察が成り立つのですから。」全くそのとおりである。正確な統計や適切な文書管理を疎かにするような国や組織がもしもあるとすれば、その未来は決して明るくないだろうし、国家であれば到底現代の先進国を名乗る資格はない。それではこの1.03という数字はどう判断すればよいだろうか。年間100人しか合格者のいない科類で0.03のずれは、直感的には大きくない。
数字の根拠となるのは、文部科学省の行った「医学部医学科の入学者選抜における公正確保等に係る緊急調査」である。http://www.mext.go.jp/component/a_menu/education/detail/__icsFiles/afieldfile/2018/09/10/1409128_002_1.pdf これによれば、1.03という数字は平成25年から平成30年までの6年間における男女別合格率の比であり、この期間の延べ合格者数/受験者数は、男性501/1935、女性101/400であった。この数字はどのくらい「歪んだ」ものだろうか?ちょっと計算すればわかるが、合格率がちょうど等しくなるのは、男が498.87人の場合だ。つまり現実と「理想」は、たった2人しか離れていないことになる。受験年度を無視して男女計2335名の受験者から602名の合格者を選んだ場合の男性合格者の数は、超幾何分布H(2335,1935,602)に従うはずであるが、この分布の501までの累積確率密度は62.7%であり、敢えて合格率が等しいという「帰無仮説」を棄却しようと思えばp値0.4をとらねばならない。とてもではないが、男女の合格率に差があるという結論はでてこない。
彼女は社会学を専門とする学者であり、当然ながら統計には詳しい。「統計は大事です、それをもとに考察が成り立つのですから」とまで言った彼女がこの「有意差なし」という事実を知らなかったはずはない。とすれば「1を越えていることには、なんらかの説明が要ることを意味します。」という発言は、控えめに言っても、統計的事実に対する誠実さを欠いた悪質な印象操作との誹りを免れないだろう。
東大、あるいは日本(そして人類)社会の抱える男女格差の深刻さは否定し難い。けれども、祝辞の内容それ自体は、大学構成員の男女比や一部不適切勧誘を行うインカレサークルの存在といった客観的事実に基づいた証拠のみでも十分根拠づけられたはずである。そして、全体の論旨が首肯できるものであるから個別の不当な印象操作を容認せよというのは、「江戸しぐさ」に対してその内容が道徳的に好ましいから歴史の捏造をしてもよいという態度と変わらない。真実や善意に混ぜられた嘘はしばしば、嘘だけの嘘よりも性質が悪い。
さらに言えば「男子学生は東大生であることに誇りが持てる」「東大の男子学生はもてます」「あなたたちはがんばれば報われる、と思ってここまで来たはず」といった発言も乱暴に過ぎる。男女を問わず、東大生や東大卒というだけで理不尽な批判を受けたりや偏見の目で見られたりすることはある。「一応東大」という決まり文句が存在し、テレビはしばしば東大生を無感情な機械か珍獣のように扱う。男でも東大であることを明かしたがらない人がいないなどとはとても言えない。合コンも男なら皆行くわけではなく、(少なくとも理工系では)相当数の学生が恋愛とは無縁なのであって、合コンに行く東大生はもてるというのは「強者は強者だ」というトートロジーにも聞こえる(もっとも、「もてる」こと自体に価値を見出さない学生にしてみればどうでもよいことだが)。そして、大学受験というごく限られた世界に限っても、努力した人が全員合格しているわけではないということぐらい、大抵の新入生は見てきただろう。そもそも、初めて会った人間の内心について「はず」などという決めつけをするのは、単に相手を意志をもつ人間として見ていないということではないか。
これらの発言を彼女自身の差別的バイアスによるものだと考えてしまうのは、果たして私のバイアスなのだろうか…… 今まさに暴力を振るってくる者への抗議ならば激情の滲むこともあるだろうが、相手は新入生なのである。解決すべき課題があり、伝えるべき言葉があるのなら、まずするべきは数字に誠実に向き合い、語りかける相手をリスペクトすることではないのか。
帰無仮説として起業だと失敗したらすぐに首をつるハメになるということが言えるでしょ。
失敗と言っても、会社潰すほどの失敗と、修正したらすむ失敗とある。
かつ、経験というのはこれをやったらうまくいく、これをやったらうまく行かないという小さな失敗の積み重ね。
よその会社であれば、その会社が事業がうまくいく前に経験を積んでるし、失敗して多少の金と周りの人手で解決できることもできる。
だけど、起業だと、許容できる小さな失敗の閾値が非常に小さく、金注ぎ込んだり、人手で解決することもできない。
起業煽りなんて、景気のいいとき起業が多く、景気の悪い時起業が少ないってのを曲解したもの。