災害時のSNS“救助タグ”にみるビッグデータ活用の難しさ

今回の九州地方の大雨災害において、Twitterでハッシュタグを用いた救助要請が(実際に救助を求めているのかは別にして)非常に多かったようだ。
今日取り上げたニュースでは、SNSでの救助もいいけど先に119番に掛けてね、ということが言われている。

これはすごくつまらないアドバイスではあるが、まったくもってその通りだ。
なぜなら、SNS上で特定の意味意図を持った発言を抽出することは非常に難しいからだ。

SNSの投稿は、ビッグデータの形として最も典型的なものだ。
そして、この典型的なビッグデータは、分析するのが驚くほど難しい。

定義論をしたいわけではないが、単にが多ければビッグデータというわけではない。
ただのWebのログなどのストリームデータや企業の在庫・売上データをビッグデータと表現することはあまりないだろう。

実際にデータをいじったりデータテーブルを作ってみると分かるが、これらの非ビッグデータとビッグデータの作りは驚くほど違う
目玉焼きとスクランブルエッグぐらい違う。

城田真琴氏の著書『ビッグデータの衝撃』では、ビッグデータの特徴として”3つのV”を挙げている。

ビッグデータとは、3V(Volume・Variety・Velocity)の面で管理が困難なデータ、およびそれらを蓄積・処理・分析するための技術、さらに、それらのデータを分析し、有用な意味や洞察を引き出せる人材や組織を含む包括的な概念である。
Volume:膨大なデータ量(数十テラ〜数ペタバイトクラス)
Variety:多様なデータ(非構造化データを含む)
Velocity:データの高い生成・更新頻度(1秒間に数十件以上)
-城田真琴『ビッグデータの衝撃-第1章.ビッグデータとは何か』より

僕も、この定義にはすごく共感できる。
試しにTwitterを開いてツイートを検索してもらえれば分かるが、データの構造が雑多過ぎるのだ。

画像や動画があるか、誰がつぶやいているのか、文字数は何文字か。
はたまた、何についてつぶやいているのか、その意図は、そしてそのつぶやきの真偽は…?

これらをデータテーブル(Excelの表みたいなもの)に構造化するのはすごく難しい。
でも、そんな無理をやり抜いてビジネスなどの意思決定に活かすのが、今をときめくビッグデータなのである。

ここまで説明すればわかると思うが、見知らぬ人にSNSで救助を求めても、その効果はあまり高くないのだ。
なぜなら、救助タグのツイートはあまりにも構造化されておらず、人間にとっても処理は難しいからである。

SNS上では、世界中みな隣人のように思われるが、隣人は隣人でしか無い。
知り合いなら助けてもらえるかもしれないが、知り合いならリアルでも近隣で生活している可能性が高いだろう。
であれば、救助要請を行っても、救助して欲しいのは相手の方かもしれない。

自分が普段使っているものの仕組みを知ることができれば、より良い選択を行うことにつながる。
学ぶこと・知ることとは、今まで見えなかったものが見えるようになることなのである。

災害時の“救助タグ”ツイートは有効なのか? 専門家「SNSは最終手段」

<概要>
今回の九州の大雨被害では、土砂崩れや路の冠水などで孤立した人々が、ツイッターのハッシュタグ「#救助」で救助要請をするケースが多く見られた。
実際に、「きのうの大雨で祖父・祖母と連絡が取れなくなりました。近くの理髪店を経営しているので、そちらに避難したかもしれませんが、あたりは土砂崩れで道も通れず、橋も流されているようなので救助をお願いしたいです」といった内容の投稿がされていた。
一方で、携帯電話3キャリアで通信障害が発生したエリアもある。
災害時のメディア利用を研究する東京大学特任准教授の関谷直也氏は、「『#救助』で救えたのなら、それに越したことはない」と前置きしたうえで、「ハッシュタグをつけて救助を求めるということはツイッターが使えるということ。
電波が使えるということなので、本当に救助が必要なら119番に電話をかけて欲しい。
GPS情報をオンにして119番にかけると、消防でどこにいるのかが分かる。
しかし、ハッシュタグをつけても、ちゃんと位置を書いたとしてもそこまで救助に行けない。
両方大事だが、まずは119番にかけて欲しい」と訴えた。
https://headlines.yahoo.co.jp/hl?a=20170707-00010013-abema-soci

コメントを残す

メールアドレスが公開されることはありません。