趣味と実益を兼ねたオープンソースインテリジェンス、@realDonaldTrump版
アンディ・パテル
Twitterボットやソックパペット集団を特定するスクリプトを書くために、最近、Tweepyを使った実験を始めた。最後にこのようなツールで遊んでからしばらく経つ。久し振りなので、まずは小さなテストスクリプトを2、3本、書いてみることから始めることにした。きちんとテストを行うためには、活動が盛んなアカウントを選ぶ必要がある。そういうわけで、@realDonaldTrumpのアカウントを選ぶことにした。
過去12か月間分のデータを集めたところで、ショーンと私は、時系列と出来事を踏まえて4つの期間に区切ったほうがよいと考えた。次のように期間を区切ることとした。
・ 365日前から、米国大統領選の投票日(2016年11月8日)までの全データ。
・ 選挙後から就任式(2017年1月20日)までの期間のデータ。
・ 就任式の後から、2017年3月4日・5日の週末の、トランプ氏のTwitterの使い方が大きく変ったときまでの期間のデータ。詳細は後述する。
・ 3月5日以降、現在までの全データ。
次の図は、曜日別および時間帯別の活動状況を表しており、上に示した4つの期間に分かれている。図を見て分かるように、Twitter活動が最も活発なのは、常に昼過ぎから午後の中頃にかけてである。08:00から12:00の間は、ほとんど活動がないことにも注目だ。商売目的でTwitterボットを開発している開発者なら誰でも、その時間帯のこのアカウントの活動には「out of band」というフラグを付けたいと思うだろう。詳しく見てみる価値のありそうな時間帯だ。
@realDonaldTrumpのツイートが投稿された時間帯。赤が濃いほど活動が多いことを示す。
次のグラフは、時間帯別のデータを折れ線グラフで示したものだ。トランプ氏の1日の中でのTwitterの活動パターンは、このデータセット全体を通してそれほど変わりがなかった点に注目してほしい。
@realDonaldTrumpの時間帯別のTwitter活動。ツイート投稿の際に使用されたデバイスごとに折れ線が色分けされている。
最後のグラフに注目してほしい。これが前述したTwitterの使い方の変化だ。2017年3月7日より前は、「Twitter for Android」を介して投稿されたツイートが、常に圧倒的多数であった。唯一、iPhoneの使用が目立ったのは、選挙運動期間のデータである。それらのツイートは、キャンペーンスタッフが行ったものである可能性が高い。
それでは、大統領就任の前後に、@realDonaldTrumpがどれくらい多くのツイートをしたのだろうか。
@realDonaldTrumpのアカウントに対して行われた投稿数(週単位)。ツイートの投稿に使用されたデバイスクライアントごとに色分けされている。
2016年大統領選挙戦の期間中に、@realDonaldTrumpのアカウントは、それ以降の月に比べて、週当たり約2倍のツイートを投稿した。2017年の第10週の、AndroidからiPhoneへの切り替えが上のグラフにもはっきりと表れている。また、次のグラフもそのことを示している。
クライアントデバイスの使用割合(パーセント単位)。4つのデータセット期間での比較。
さて、@realDonaldTrumpのアカウントが突然AndroidからiPhoneへ変わったのはなぜなのか。業務上、何かがあったということはあり得る(セキュリティ上の理由)。または、次のツイートと関係があるのかもしれない。
How low has President Obama gone to tapp my phones during the very sacred election process. This is Nixon/Watergate. Bad (or sick) guy!
— Donald J. Trump (@realDonaldTrump) March 4, 2017
とても神聖な選挙戦中に、私の電話を盗聴するとは、オバマ大統領も落ちたものだ。これはニクソンのウォーターゲート事件と同じだ。悪い(または病的な)奴だ!
— Donald J. Trump (@realDonaldTrump) March 4, 2017
理由はどうであれ、このような活動状況であることには変わりはない。
次のステップは何か。
恐らく、我々自身のボットを作ることだろう。ボットは現在作成中であり、今後、これに関する投稿をもっと行っていくつもりだ。
カテゴリ