以前の技術では扱えなかったほど大容量のデータを指す。
この言葉は、クラウドという新しい流行り言葉に合わせて使われるようになったが、それ以前はデータマイニングと呼ばれていた。
現在、社会のすみずみまでコンピュータやセンサーが行き渡り、あらゆる取引が電子化された今日において、その履歴情報はログとして蓄積されている。そのようなログを含めて、あらゆる情報を基に、統計的分析を行い、知見を生み出そうとする営みが成されている。
膨大に蓄積した情報から本人が知られたくないプライバシー情報を割り出してビジネスに活用されたり、そうした情報を流出させられたりする可能性がある。情報を提供する際の本人同意の取り方や、異なるデータを紐付けることで個人が特定できてしまう場合の取り扱いなどについてルールを整備する必要があり、企業や政府機関のデータ利用がプライバシー保護の観点から適切であるかを監督する機関を設置したりしていくことが求められている。