SlideShare a Scribd company logo
イミュータブル データモデル (入門編) 
kawasima
背景 
•正しくデータモデリングを学んだ人(1NF~5NFの違いがわかる人)がモデルを書く のが理想だが、現実は難しいところもあ る。 
•そういう状況において、モデリングのエ キスパートでなくても、致命的な問題を 起こしにくいモデルを作るための手法で す。
ゴール 
•モデルの複雑性を増すのは、CRUDのうち のUPDATEに関する要件です。 
•モデルに対するデータの更新を極限まで 削ることによって、拡張に対して開いて いて、修正に対して閉じている堅牢なも のにします。
イミュータブル? 
•実際にはUPDATE全くなしに業務アプリ ケーションを作るのはハードル高すぎる ので、ミュータブルな箇所を特定し、一 定の意味付けをおこないUPDATEを許可す る、という文脈です。 
•「更新日時」という属性を徹底的に排除 することにより、イミュータブルなモデ ルの獲得を目指します。
モデリングの手順
Step1 エンティティの抽出 
発送担当者が受注リストをもとに、商品の在庫を確認し、在庫が あれば商品を発送する。 
① 要求仕様の「動詞」を抜き出しエンティティとする。 ② ①に関わる「名詞」を抜き出しエンティティとする。 ③ エンティティ間の関連に線を引く ④ 属性や候補キーも分かる範囲で書いておきます。 
間違い! 
この段階で実装をプロパティファイルにするとか、Enum にするとか決め打ちでエンティティとして表さないのはや めましょう。 
まず、はじめにエンティティを抽出します。
エンティティ名の付け方 
エンティティの名前は、短くその意味を的確に表現するものでなくて はなりません。なくても意味が通じるワードは使わないようにしま しょう。 なくても意味が通じるワード 
情報 
データ 
処理 
~物 
マスタ 
記録 
管理
ときどき論理設計=日本語名称、物理設計=英語(ローマ字)名称とプロ セス定義して、英語名称を付けるのを後工程にまわすプロジェクトが ありますが、そんな必要はありません。命名は和名/英名セットでおこ ないます。 
名付けには用語辞書を作って、ある程度機械的におこなうのがよくあ るパターンですが、安易に短縮名称を使わないようにしましょう。 
母音を抜いて短くする短縮名付け文化圏があるようですが、これを機 械的にやるとヒドイ英名が付けられるもとになります。 
QUEUE → Q KIKAKU → KKK 
論理設計と物理設計
Step2 エンティティの分類 
会員ID 
姓 
名 
郵便番号 
住所 
電話番号 
注文番号 
注文会員ID 
注文日時 
注文 
会員 
リソース 
イベント 
洗いだしたリソースとイベントに分類します。 基準は属性に”日時” をもつかどうかです。 または、Step1の①の動詞から抜き出したエンティティは“イベ ント”に、②の名詞から抜き出したエンティティは“リソース”に なるはずです。
エンティティを分類するのに、未だ“マスタ”“トランザクション”とい うものを使うプロジェクトがありますが、この定義は曖昧で大抵どっ ちに分類するかでムダな議論のもとになります。 
「システムで更新しないものを“マスタ”とします」 
「マスタメンテ機能でされるんじゃない?」 
「あぁ、マスタメンテ機能での更新はノーカンです」 
「日に1回、社員マスタは社員管理システムから送られてきて洗い替えするんだけ ど」 
… 
その点、リソース/イベントの分類は非常に明快で迷うところがありま せん。 
マスタ/トランザクションという分類
Step3 イベントエンティティは1つの日時属性 しかもたないようにする 
受付番号 
注文会員ID 
注文日時 
注文確認者 
注文確認日 
請求書出力フラグ 
入金予定日 
入金日時 
入金者氏名 
登録日時 
更新日時 
キャンセル日時 
キャンセル取消日時 
発注 
注文番号 
注文会員ID 注文日時 
注文 
発送指示ID 
発送指示者 
発送指示日 
注文番号 
発送指示 
One fact in one place. 
…
イベント系エンティティは、業務の記録です。すなわちイベント系エ ンティティに対する更新は、記録の更新、悪いいい方をすれば記録の 改ざんになる訳です。 
したがって、イベント系エンティティは更新が入らないデータが格納 されるものと考えることができます。 
業務の“記録” がイベントである
よく全てのエンティティに一律で登録日時や更新日時を付ける設計 ルールを見かけます。あまつさえ、それを自動的に登録してくれるフ レームワークもあるようです。 
これは何のためにあるのか再考してみましょう。 
おそらく最初の動機としては、何か問題があったときにトレースする ためと思われますが、リソース系エンティティにつけても1世代の更新 しかわかりません。そして更新前の状態もわかりません。本当に問題 をトレースしたいのであれば、変更履歴を別のエンティティとして記 録するべきです。 
一方、イベント系エンティティは登録/変更の日時を属性としてただ1 つもつので、同じ意味の属性を別にもたせる必要はありません。 
全エンティティに付ける登録日時や更新日時
都道府県コード 
都道府県名 都道府県略名 登録日時 登録者ID 更新日時 更新者ID 
思考停止の象徴エンティティ 
都道府県にすら、更新日時 Σ(゚д゚lll)
Step4 リソースに隠された イベントを抽出する 
会員ID 
姓 
名 
郵便番号 
住所 
電話番号 
会員 
リソースエンティティに更新日時を持たせたくなるのは、リソースにまつ わるイベントが洗い出せていないことが原因と考えます。 
•何かトラブル起こった時に原因をトレースす るため会員が自分自身で会員情報変更ページ から変更する。 
•規約に違反した会員であったため、お客様セ ンターのオペレータが強制退会を行う。 
•会員からの誤った退会をしてしまったが、取 り消してほしいとの問合せを受けて、お客様 センターのオペレータが会員の復会を行う。 
更新日時
会員ID 
姓 
名 
郵便番号 
住所 
電話番号 
会員 
会員変更ID 
会員ID 姓 名 郵便番号 住所 電話番号 変更日時 変更イベントID 変更理由 
会員変更 
大抵の会員を管理するシステムではこういうモデルになるのでは ないでしょうか?
リソースに対する変更の記録としてのイベント系エンティティは、い わゆる履歴テーブルと言えます。 
履歴テーブルの実装には、「これが正解!」といえるものはなく、業 務要件などに照らしあわせて設計することになります。 
このイミュータブルデータモデリングの手順のように、リソースに対 する変更日時を記録したいと思ったら、これをイベントとして切り出 すことを考えると、比較的失敗しにくいように思います。 
履歴テーブル
リソースは、イベントによって引き起こされる属性の変化の 
一時点でのスナップショットである。 
会員ID: 001 
姓: Kawashima 
名: Yoshitaka 
郵便番号: 111-XXXX 
住所: 東京都台東区 
電話番号: 090-xxx-xxx 
会員ID: 001 
姓: Kawashima 
名: Yoshitaka 
郵便番号: 111-XXXX 
住所: 東京都台東区 
電話番号: 070-xxx-xxx 
会員ID: 001 
姓: Kawashima 
名: Yoshitaka 
郵便番号: 167-XXXX 
住所: 東京都杉並区 
電話番号: 070-xxx-xxx 
電話番号変更 
住所変更 
業務的に計画された更新がない、または更新のイベントをトレースする必 要がない、場合に限り、このスナップショットだけを変更イベントをもた ないリソースエンティティとして定義される、と考える。
Step5 非依存リレーションシップを 交差エンティティにする 
リレーションが非依存である場合、外部キーにNULLを許し、後でアップ デートすることが可能になってしまいます。 こうした要求の裏には、別のイベントが隠れていることがあります。 
プログラマID 
姓 名 プロジェクトID (FK) 
プログラマ 
プロジェクトID 
プロジェクト名 
プロジェクト 
プログラマは、担当するプロジェク トがなくても、存在しうる。 
「アサイン」というリレーション シップが間にあるのでは?
R-R間の交差エンティティ 
社員ID 
姓 名 部門ID (FK) 
社員 
部門ID 
部門名 
部門 
新人が部門に配属されたら部門IDに 
値を入れる。 
社員ID 
姓 
名 
社員 
部門ID 
部門名 
部門 
部門ID 社員ID 
配属日 
配属 
配属イベントが潜んでいる。
E-E間の交差エンティティ 
請求ID 
請求日時 
請求書宛先 
請求金額 
受注ID 
受注日時 請求ID 
受注 
請求 
請求ID 
請求日時 
請求書宛先 
請求金額 
受注ID 
受注日時 
受注 
請求 
複数の受注をまとめて請求する。 
受注ID 
請求ID 
受注-請求 
対応する請求のデータができたら請求IDに 値を入れる。 
(時系列の逆転したリレーション) 
E-E間の場合は、イベントが潜むのではなく、対応表が必要に なる。時系列の逆転が起こらないように設計する。
交差エンティティは多対多の場合だけのものではない 
B 
A 
ER図で、このような形だけみて、「エンティティAとエンティティBは、 多対多じゃないんだけどっ!」というカーディナリティだけでリレー ションシップを決めてしまう人がいます。 
重要なのは、非依存リレーションシップということは、互いに独立に 存在しえて、何らかのイベントによって、それらに関係性が作られる という、このイベントが何か洗い出せているか? という点です。 
これをやらずに、カーディナリティだけでリレーションシップを考え ると、業務上必要だったイベントエンティティを見落としてしまうこ とに繋がりかねません。
まとめ
•更新日時に着目し、それらをエンティ ティから追い出すだけで、それなりの堅 牢なデータモデルが書けるようになる。 
•ただ、これだけでは不十分なところある ので、ちゃんと本を読もう。 
佐藤正美(2005) 『データベース設計論 T字型ER』 
羽生章洋(2006) 『楽々ERDレッスン』

More Related Content

イミュータブルデータモデル(入門編)