テレビデータで株価は予測できるか?

オルタナデータという言葉をご存知だろうか。

オルタナティブ・データ、つまり「本来のものを代替補完する(= Alternative)」データを使って、予測やシミュレーションの精度をさらに高めていこうというデータ分析の世界の言葉だ。たとえば、表題の「株価」を予測する場合、予測したい企業のこれまでの株価の動向や直近の決算データなどは、株価予測をする上での本来のデータと言えるだろう。このような本来データを使った予測値の精度をさらに高めようとする場合、今度はその周辺のデータも加えてデータの厚みを高めようとしていく。たとえば株価に直接影響する景気指標や業界動向、競合状況、需給要因などの金融経済系のデータがその中心となるが、さらに精度を高めていくためには非金融系の間接データの活用も重要になってくる。金融工学が高度に発展し様々なテクニカル手法が開発された今、更なる差別化のためにはこの従来はあまり用いられてこなかった非金融系の間接データの活用が重要な意味を持つようになった。このように従来の分析では用いてこなかったデータがオルタナデータだ。

特に、様々なデータを学習することでこれまでにない斬新なモデルを作り上げることが出来るAIの登場で、これまでは無関係か、相関はあっても精度が劣ると思われていたこのオルタナデータの活用が、最先端のデータサイエンスの世界では当たり前のものとなった。

たとえば天気予報、特に湿度や気圧のデータは特定の商品やサービスの需要と密接な関係があることがわかっているし、衛星写真データを活用してショッピングセンターの駐車場の混み具合からエリアやチェーンストアごとの利用動向を指標化するなどといったサービスも現れた。携帯電話の位置情報も、今では当たり前のように使われている。

そして、テレビデータである。
 

エム・データが作成するテレビの全放送内容を記録したTVメタデータを使って株価予測ができないか?

ライフログ総合研究所では、TVメタデータを使った簡単な株価予測モデルを作ってみた。
 

図1
 

図1をご覧いただこう。

これは2015年から2019年までの期間に株式会社ワークマンの情報がテレビ番組に露出した週あたりの秒数(一段目)と、それと同じ期間のワークマン(東証7564)の週ごとの株価の終値(四段目)、売買出来高(五段目)を並べてみたグラフだ。グラフの二段目は一段目のワークマンの週別テレビ番組露出秒数の推移を期間の異なる複数のトレンド値で加工してモデル化したもの、三段目はこのモデルからトレンドの変換点、具体的に言うとワークマンのテレビ番組露出量の上昇、下降トレンドの転換点を図式化したものだ。単純にグラフが正の値(y軸が0よりも上)を取る時がテレビ露出量が上昇期のトレンドに入っていることを示し、負の値の時が下降期のトレンドであることを示している。番組露出量が上昇期にあるときは、なんか最近ワークマンの話題が増えているな、と多くの人が思う様になり、下降期ではワークマンの話題最近はあまり聞かなくなってきたかなと多くの人が感じる様になる傾向がある。このポイントが株価予測にあたって後々重要になるところだ。
 

ワークマンは2019年の株価高騰銘柄の一つである。

それまで男性向けの作業服、いわゆる3K職場の御用達専門店と思われていたワークマンが、いつの間にか「ワークマン女子」という言葉まで生まれるほどのトレンドスポットに生まれ変わっていたのである。この高騰銘柄ワークマンを2019年よりも前の時点で仕込むことができたら、とは誰もが思うことだろう。それには人とは違う情報源で人よりも先んじた行動を行う必要がある。他の人とは違う角度から対象を観察するのだ。それは他人が使っているのとは異なるデータ、尺度、分析、そう、ここにオルタナデータ活用の意味がある。たとえば、テレビデータを用いると2019年よりもはるか以前からワークマンの買い場のタイミングを知ることができたかもしれないと聞くと、ちょっと興味が湧いてこないだろうか?

上から四段目の株価のグラフを見るとそれまで2,000円未満で推移していたワークマンの株価が2017年の秋以降から目立った上昇を始め2019年のピークに向けて急激に高騰していくのがわかる。

そして三段目のグラフには2015年以降現れ始めたワークマンのテレビ露出トレンドの転換点が、まるで株価の高騰に合わせたかのようにその頻度を高めていくのがわかる。

面白いのは上段のグラフと下段のグラフは全く異なる出典のデータであることだ。上三段はテレビの露出データとそれを加工したもの、下二段は株価と売買の出来高だ。上三段は民放各局とNHKが放送したテレビ番組の内容を集計したものであり、下二段は東京証券取引所での売買を記録したデータだ。テレビ局と東証に、テレビ局の番組編成と東京証券取引所での株式の売買に、情報の連動性など無いはずだ。ところが、このテレビ露出量と株価という全くソースの異なる2種類のデータを時系列で並べてみると、なんとそのトレンドや活性度の動向がピタリと一致して見えるのである。不思議ではないか?

私の様に日頃から様々なデータの分析をしている者からすると、この様な美しい一致はデータの神がテレビの放送を利用して愚かな私たちに株価の変動を教えようとしているとしか思えないのである。このデータを使って、儲けなさいと。豊かになりなさいと。

さらによく見ると、三段目のテレビの露出データだけから抽出したテレビ露出トレンドの変換点は、株価のトレンドの変換点と連動しているように見える。ワークマンの株価が上昇していく局面ではテレビ露出トレンドも上昇を示し、株価が下落か停滞を示す局面では、テレビトレンドも下降を示している。繰り返すが、このテレビ露出トレンドモデルには株価のデータが一切含まれていない。純粋にテレビの露出データだけから算出したトレンドモデルが、なんと株価の動向を説明している様なのだ。不思議では無いか?
 

テレビデータの株価予測は、勝率9割!!

ワークマンの一致は偶然なのだろうか?

我々はこの同じモデルを使って複数の上場銘柄のバックテストを行ってみた。

その結果、複数の企業のテレビの露出データから171回のトレンド上昇の変換点シグナルが算出され、なんとそのうちの154回で株価の上昇が同時に見られたのである。その率は90.1%。テレビの露出秒数が上昇トレンドに転じる時,その同じタイミングでその企業の株価も上昇しだしたである。その確率は9割、テレビ露出量の転換点で買いを入れれば、勝率9割で上昇株を購入することができる、これは興味深い話では無いだろうか?

このテレビ露出量のトレンド上昇転換点171回の全てでその銘柄の株式を購入し、同じくトレンドの下降転換点で株式を売却した場合、通算の騰落率は113.3%であった。最高は244.6%、最低は92.1%。171回中下落した17回のケースも含めた通算で13.3%のプラスである。この時点ではテレビでの露出内容は全く考慮していない。どの様な内容であろうと、その企業のテレビ露出量が上昇トレンドに入れば買い、下降トレンドに入れば売り、という極めて単純なモデルでの勝率90.1%、騰落率113.3%である。これに株価下落ケースに見られる株価に対してのマイナス要因となるテレビ露出、たとえば今回のテストで見られたのは「個人情報漏洩」、「下方修正」などだが、この様な株価にとっては不利と思われるテレビ番組露出内容をチェックしたうえでトレンド変換点での売買行動を選択するルールを入れれば、勝率をさらに上げることができるだろう。騰落率も今回の試算はテレビ番組露出量が下降トレンドに入った時に売り、というややホールドしすぎなルールであり、実際はテレビ番組露出量が下降トレンドに入る以前に株価のピークを付けるケースが多いので、たとえば売りはより実践的な株価ピークアウトを判別するルールにすれば収益性をさらに高めることができるだろう。

収益性の分析で分かったことだが、今回のモデルに採用したテレビ露出量のトレンド変化を判別する期間設定を変更していくことで、たとえば変化により迅速に反応する敏感型のモデルや、変化が確実になるまで反応を遅らせる遅行型のモデルなど、投資戦略に合わせた複数のアレンジを行うことも可能だ。金融の専門家からの知見があれば、さらに面白い展開も出来るだろう。

テレビと株価という、異なるデータを用いて新しい世界が開きそうである。

本稿にご興味をいただけたら、ぜひエム・データまでお問い合わせをいただきたい。

共同研究やより実践的な応用など、様々な方のお力をお借りしてこのデータの神がもたらしてくれた”ギフト”に応えることができればと思う。


関連記事

2021/5/31
コロナ禍テレビ出演者の年齢層は下がったのか?
2021/3/31
テレビ×音楽・データ活用実践
2021/1/29
東日本大震災:福島県双葉郡10年のテレビ報道
2020/12/23
2020年アニメ声優出演ランキング
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.