- 第61回(2023/03/27): 記事紹介 - BIG DATA IS DEAD
- BIG DATA IS DEAD を読んで
- 最近 Twitter でも界隈でいいね・リツイートされていた記事を読んで二人の感想を紹介
- データ量ではなく,より良い意思決定を行うためにデータをどう活用するか,質はどうかを考えることが大事
- ほとんどの会社はビッグデータと言われる数百ペタバイトのデータを持ってる会社はなくて,数百ギガバイト程度
- 実際使うデータは直近のデータが多く,古いデータは使わないことが多い
- 使うデータも期間や用途を絞った形で抽出されたデータが多い
- 機械学習のタスクにもよるが,最近は少量のデータでどう精度を出すかに傾いている
- 「古いデータを保管しているのであれば、なぜ保管しているのか」を改めて考えてみても良いかも
- データを保存することは悪ではないが,保存する Why, What を意識すべき
- BigData is Deadは言い過ぎな気もするが,筆者が言うほどのデータ量は要らないと思うし,それに対処できる技術も増えてきている印象