マインスイーパで考える濃度のおはなし
はじめに
まさかのダイアリーもう一つ作ってみました。(い、いまさらー!!)*1
改めまして
ちょうど今、調理冷凍食品からの農薬マラチオンの検出が話題です。
報道も加熱しておりますが、その中で「おやおや」と思うことがありましたので*2、何かわかりやすく説明できないかなー、と思ったのでやってみます。
はじめに:ppmとは
parts per million の略。「100万分の」という感じです。
似たもので身近なのが%、(parts) per cent、「100分の」があります。こちらは日常的に使いますよね。ppmは%をさらに細かくしたもの、1% が10,000ppmとなります。
ホースでも羊羹でもなんでも良い、何か長いものを想像して、100個に切ったうちの一つが1%、もーーーっと細かく100万個に切ったうちの一つが1ppmという感じです。
で、このあたりの"なんとか分のなんとか"というものは濃度に「近い」概念です。
「近い」というカッコの表現をしたのは何故かと言うと、厳密にはちょっと正確ではない。1mg/kgも1mL/Lもどちらも1ppmとして表現できるけれど、例えば1mgのある物質を1Lの溶媒(水でもアルコールでも)に溶かした場合も1ppmと言うことがあったりします。(水の場合はほぼ1L=1,000gとして良いけれど、他の溶媒はそうではないので容量あたりなのか重量あたりなのかというところで化学系の実験を一回は失敗したりします)
まあ、そのおかげでざっくりした話をする時には逆に使いやすいんですけどね。口語的とでも言っていいかもしれない。
で:マインスイーパの出番
さてご存知マインスイーパ、windowsにとりあえずついているゲームということで皆さん遊ばれたことがあるかと思いますが、「枠内にある地雷を見つける」ゲームです。
この画像ですと、10*10マスの中に、左上に表示されている10個の地雷が埋まっています。
つまり10*10=100、マスで数えるところの10/100で、地雷は10%の濃度と考えることができます。(この場合のオオモトの100マスを母集団とかいいます)
この時に、結果論的にこういう見方も可能です。
「緑色の部分は1/32で3%、一方のオレンジ色の部分は5/15で33%」じゃないか、と。これはこれで間違っている訳ではない。
でも。
遡って最初の図の状態で
の緑色、オレンジ色の部分がどうかなんて誰もわからないですよね。
ましてや、仮にオレンジ色の部分だけ見た場合33%ですから、そこだけ検査してしまうと全体100マスのうち33%、33マスに地雷があるかという過大な評価をしてしまうことになります。逆に緑の部分だとこんどは全体で3マスしかないという評価になる。おおもとの地雷が10個、10%なのにです。
これが分析屋さんのもっとも恐れそして嫌う「バラつき」「不確かさ」というものです。
通常の農薬の検査では一般的に食べる部分をまるごと粉砕し(均一化といいます)、そこから少し採取して検査をします。キャベツ2玉とか4玉とかから10gだか20gとかを採る、その時に「一番外側の葉も芯もすべて均等になるよう」念入りに作業を行います。均等になっていないと、10g取ったうちの殆どが外側の葉でたまたま付着していた農薬が検出していた場合、もう一度同じ人でも違う人でも誰かが確認しようと思っても近い値が出ずに「で実際のとこどうなのよ」というのがわからなくなります。
今回(や前回の餃子事件)のような作為性・事件性が疑われる場合は、例えばまずそこそこのグループ(例えば1包装)のコロッケを全て4等分なりした各部分を1個ずつ集めて均一化して分析します。*3
あくまで机上の計算ですが、6個入りの包装のうち1個だけが15,000ppmの汚染をしていた場合、6個まとめて分析すると15,000を6で割った2,500ppmとなります。この場合の一個15,000ppmも一包装2,500ppmもどちらも間違いではない。
その一包装あたり2,500ppmという結果を持って、じゃあさっき4等分した残りを一個ずつ分析してみよう、っていって15,000ppmがはじめてわかるわけです。後出しジャンケンですよね要は。
逆にじゃあ一包装から一個ずつ取って検査したらどうかというと、まあ大体ハズレで不検出になって見落とす訳です。
不検出でしたー、ってしたいならこの方法はオススメです。あとでどうなっても知らないですが。
という訳で、こういうピンポイントな汚染については時間が経過するごとに検出濃度の最大値がどんどん上昇します。*4そこに誰の悪意や隠蔽や陰謀がなくてもね。
なので、産経新聞の書かれている
衣と中身の重さの違いなどを勘案し、商品全体の“平均値”を出したとみられる
という文章ですが、「出したとみられる」でなく、ppmというのはそもそも「そういうもの(平均値)なんだ」というだけのことです。食品を買った時の栄養成分表示を見ることがありますが、100gあたり、1包装あたり、1個あたり、はありますが「衣1gあたり」「中身1gあたり」はないですよね。「容器上側の上座1cm〜2cmの衣1gあたり」とか言われても困りますよね。
ましてやクリーム系の揚げ物については衣と中身の境界ってあってないようなもの、えいやで決めた部分ですので、「1gあたり」の部分に一個あたりや一包装あたりほどの厳密さが出せない。衣1g取ったつもりが衣部分0.8gタネ部分0.2g取っちゃってるかもしれない、そういう不確実さを含んだ数字、「その程度の信頼性しかない」数字なんです。*5
上のマインスイーパでいうところの「オレンジ色のマスに地雷がいっぱいあったよー」「そうだねー」という、それだけ。
このあたりは普通に想像できる単位までにしておくのが正当ではないでしょうか。
もちろん状況からしておそらくは外側の方が高濃度に汚染されているだろうなという気はしますが、それはあくまで想像だったり後付の理屈であって、「別々に分析したら外の方が濃度高かった」というのは「そうかじゃあ中に練り込まれたり注入されたんじゃなくて外からかかったんだろうね」というだけの話、ということです。つまり捜査・調査がその段階まで行きましたよ、と。それを逐一公表するのであればむしろ(いるかどうかまだ不明ですが仮に事件性があったとして)犯人に捜査状況を伝えるデメリットの方がどっちかというと大きいんじゃないかなー、とは思いますが。
というわけで、きちんとやろうとすればするほど数値が低い値から高くなるのでそこはあんまり叩いても意味ないよ、ということを、自分の知っているちゃんとした分析者の皆さんの顔を思い浮かべながら思ったというお話でした。
追記ですが
ちなみに同じ数値が倍になるのでも、マインスイーパでいうところの100マス中10個と思っていた地雷が20個、という場合はそれなりにオオゴトです。(特に普通の残留物質の測定の場合は一割二割でも報告書の騒ぎになることががが)
ただそれもピンポイントな汚染については隣あってるものが何万倍の世界なので、いいからとにかく可能な限り回収いそげというのが一番大事でしょうね。
さらに追記(1/8夜)
思ったよりtwitterとかで好意的に扱って頂いて感謝です。
tweetついでにコメントされてた方の中で「6個のコロッケ4等分したら15,000を24で割らないといけないんじゃ?」と書かれていた方がおられました。(すいません、見させて頂いたのですがTLで流れてしまって…)
思わずああその気持ちわかります、と思いました。
というかうっかりしていると実験の計算するときに時々間違えたりするんですが、「15,000ppmのコロッケ」について、汚染がコロッケ一個の中で例えば前後左右のバラつきが少ない(一つの角だけに原液が付着しているなど極めて局所的な汚染がない)場合、例えば取り出して縦横に4等分したらそれぞれ15,000ppmのままなのです。汚染物の絶対量は1/4になりますが、母集団も1/4になるので。「濃度」というのはそういうものなんですねえ。*6
なので、例えば汚染コロッケ一つ、かつ汚染が一個のうちそんなに局所的でない場合は、一包装の中身それぞれ1/3でも1/6でも結果はそんなに大きくぶれないです。
むしろその際重要なことは、コロッケ6個それぞれはできるだけ同じような重さになるように選ぶことでしょうか。A〜Fのコロッケがあるとして、それぞれ5gずつ採取しているのにCだけ15gの欠片を取ってはダメということです。そう、Cが汚染コロッケだったら全体の値が3倍になりますよね。
もちろん一包装の値を出すとして、作業的にも分析結果の確かさも6個のコロッケ全部をミキサーでウイーン!ってやるのが一番なのですが、そうすると今度は検出してしまったらそれ以上の調査のしようがなくなって、高濃度少量汚染なのか低濃度で全部汚染されていたのかなど詳細な調査ができなくなる訳です。ジレンマです。
ちなみにこういうのは「縮分」(しゅくぶん)といいます。粉や穀類なんかはそれ専用の機械があったりして面白いので、興味ある方はぐぐってみられては。
分析屋さんの仕事現場を見たことある方は少ないと思いますが、何気なくサンプルを切ったり混ぜたりしているようで色々気を配るところ、あるんですよね。
*1:いや堅いこと難しいこと用のはあった方が便利だなと思ってましたしはてブロも一応作ったのですがとりあえずダイアリーの方が慣れてるしほら
*2:http://sankei.jp.msn.com/affairs/news/140107/crm14010707370002-n1.htm
*3:人手と時間と機械が無限にあれば全ての製品の外側と中身を一つづつ検査したいところですがすごい勢いでリコール品が集まる中全く現実的ではないので
*4:反対に「検出率」はものすごい勢いで減ってるはずだけど誰も報道しない
*5:仮に全く同じサンプルがあったとして、分析者によって数割は数値にブレが出る気がする
*6:別の切り口で言うと、同じ「%」を使うもので税金がありますが、100万円に対する5万円と、それの1万分の1しかない100円に対する5円もどちらも「5%」ですよね。って逆にわかりにくいか