経済・企業 ビジネスに効くデータサイエンス
コロナ統計も嘘だらけ?政府の経済統計が「グダグダ」な理由=松本健太郎(データサイエンティスト&マーケター)×鈴木卓実(エコノミスト)
GDPは信頼できる数字なのか?
(鈴木)鈴木卓実と申します。2003年に入行し、2018年2月に退職するまで、約15年のあいだ日本銀行に在籍し、主に統計を担当していました。
関わった統計としては、日銀短観、マネーストック統計など様々あります。マネーサプライ統計からマネーストック統計へちょうど切り替わる時期の実務を担当していました。
他には資金循環統計にも関わっていました。毎日新聞から「数字が30兆円もずれた」と批判された統計です。あの批判記事自体には反論がありますが(笑)。
後は業種別貸出統計です。スルガ銀行のシェアハウス融資が炎上しましたが、実は私は10年ほど前、この仕事を通じて、収益物件向け融資を把握するための系列追加に関わっていました(笑)。
日本銀行では10年ほど前から、個人のアパート・マンションローンに注目していました。当時の産業分類にはまだ「個人による貸家業」がなかったんです。個人の住宅ローンだと、返済が滞れば破産となり、すぐ官報に掲載されてしまいます。ですが、それとは違って限りなく「事業」に近いだろうと判断して、新たな業種として産業分類を作りました。
作った人間の意図としては「存在を把握して、監視してますよ」という意思表示ですね(笑)。
(松本)日銀の公開する公的統計、それから政府が公開する公的統計、様々あると思いますが、最近の政府公的統計はクオリティが緩いんじゃないかと思っています。日銀で統計を作っておられた立場から見て、どのように思われますか?
(鈴木)日銀の公的統計もいろいろありますが、銀行や信金から直接取れるデータは、非常に堅く、精度も高いと感じています。全数調査をやっていて間違いもない。経済統計の中ではこうしたことは非常に珍しいのです。
たとえば回答義務がある国勢調査でさえ、回答率は100%ではありません。だから日本の人口だって、実際は10万人単位で「ずれ」が生じるわけです。
ただ、公表値の「ずれ」が、実際に景気の変動を意味しているのか。それともサンプルを変更したからなのか。そうした確認を行うのは、現在の政府の公的統計では非常に難しいと思います。
(松本)「ずれ」のある数字をベースに、その数字が正しい物として政策の議論を行うことに関して、私は非常に違和感を抱いています。例えば『データサイエンス「超」入門』(毎日新聞出版)にも書きましたが、GDPでコンマ数%下振れるだけで政権が吹っ飛ぶ可能性があります。しかし、GDPだって当然ズレるわけです。
(鈴木)たとえば、在庫量の変動のせいで、GDPの速報値と確報値がズレるという問題があります。ズレをあらかじめ見積もるような作り方をせず、実数ベースで作っているからしょうがないのですが、このズレによって政策担当者が景気の方向感を見誤る可能性があります。
またそれとは別に、今のGDPは30兆円ほど過小評価なんじゃないか、という論文が日本銀行から出ています。
実は、今のGDPは税務統計を活用できていません。この税務署の統計データをもらって、日銀のなかでGDP計算を再現してみたところ、約30兆円も違っていた、というのです。
(参照)税務データを用いた分配側GDPの試算
https://www.boj.or.jp/research/wps_rev/wps_2016/data/wp16j09.pdf
(松本)今の政権はGDP600兆円を目指しましょうって言っていましたが、本当はすでに達成していたかもしれないんですね。
(鈴木)その通りです。税務調査は性質上、誰もが少なめに申告しようとはしますが、多めに見積もることはほとんどありません。なので「堅い数字」のはずです。
その税務署の数字ベースで計算して、それでも30兆も過小評価しているとなると、本当のGDPは30兆どころか「もっと上」の可能性さえあります。
(松本)驚きました。日本経済のイメージがまるで変わってきますよね。
(鈴木)今、消費税が話題になっていますが、消費増税されるたびに「駆け込み需要」と「反動減」があると言われています。
その「反動減」を防ぐために、いろいろな対策を打ち出していましたよね。
ですが、この「駆け込み需要」も「反動減」も、実はほとんどなかったんじゃないか、という説すらあります。ちゃんと計測できていないんですよ。
(松本)そうなると、消費増税のショックをやわらげる政策自体、やっていいのかどうなのかまるで分からなくなりますね。
「たかが統計の話」と思われるかもしれませんが、かなり大きな話になってしまいます。
日本政府には「景気がいいか悪いか」見えていない……
(松本)GDPの場合、メディアが注目する「速報値」よりも、実は「確報値」のほうが大事だということになると思いますが、統計を作る側として、このデータは実は重要ですよっていうのはほかにもありますか?
(鈴木)「法人季報」は見たほうが良いですね。データベースがしっかりしていて、使いやすいんです。
企業のバランスシートに近い形で公開されているので分析しやすく、業種別の数字も確認できます。経済メディアなんかでは「この業種が近年伸びている」という、いわば「雰囲気」で語る話がよくあると思うんですが、この「法人季報」で見ると実は全然伸びていなかった、なんて分かったりします。
(松本)そういう統計・データをきちんと分析することによって「日本経済はこの30年、実は低迷していなかった」といった結論になることもありえるでしょうか?
(鈴木)あり得ると思います。いま、正しい公的統計の数字が見えなくなってきていて、経済の方向感がわからなくなっていますよね。
(松本)公的統計を提供する側が、正しい数字が分からなくなっている。結構、重要な話だと思います。失礼な言い方になりますが、統計作成の現場にスペシャリストが減っているのではないでしょうか。ちなみに日銀の統計の部署って、スペシャリストがそろっているんですか?
(鈴木)国際会議の副議長を務める人もいますので、それなりにスペシャリストはいると思います。
(松本)そうしたスペシャリストから見て、政府に限らず、いろんな行政機関が出している統計の中には、本当に専門家が担当したのか怪しいデータもあるんでしょうか?
(鈴木)おそらく大抵の公的統計は、基本的な設計に関してはスペシャリストがやっていると思います。その後の運用において、担当者が2代目、3代目と代替わりしていくと、当初のクオリティが維持できなくなってくることはあると思います。どの仕事にも言えることですが。
(松本)もし顧問などの立場として、そういう統計をやり直さなければならなくなったとしたら、真っ先に何から着手しますか?
(鈴木)統計の世界では、Garbage In Garbage Outという言葉があります。要はゴミデータからはゴミみたいな結果しか生まれないということです。ですから、まずは「基礎の数字をちゃんと取る」ところからはじめなきゃいけない。ですが、これがものすごく大変なんですね。
(松本)僕自身も、『データサイエンス「超」入門』の最後の章に掲載した「エンゲル係数急上昇の謎」で、家計調査のデータを調べました。
家計調査って、回答するのがめっちゃ大変なんです。シャケ80グラム、豚肉120グラムと、自分で記入しなければならない。こんな面倒な調査票、いったい誰が真剣に書くんでしょう。その辺の「書き手視点の調査票設計」ってできないものなんでしょうか。
(鈴木)特に家計調査については、今の時代、紙での調査には限界が来ていると思います。時間のある人しか記入できないので、その時点でサンプルバイアスが発生していますよね。
いっそカードを渡して、POSデータと紐づけるとか、そういう方法を検討すべきです。実は物価統計ではPOSデータを活用し始めています。
ネットショッピングは「物価」に反映されていない!
(松本)物価に関して質問させて下さい。各組織が出している物価のデータがごちゃごちゃすぎて、物価が果たして上がっているのか下がっているのか分からない、という状況にあると感じています。
(鈴木)どのように物価統計が作られているかと言いますと、家計調査の「何を買いました」というデータでウエイトを作って、その後の別の調査で品目と紐づけていくんです。ただ、品目が多すぎて、代表するものの価格しか取る方法がありません。
たとえば「ハンバーガー」の価格。おそらく、一番売れているマクドナルドのチーズバーガー、フライドチキンだったらケンタッキー、という風に紐付けています。それ以外の商品の価格を取ると、収拾がつかない。
また、ネットで買った物は調査対象外なんです。原則として実店舗ベースなんです。いまの時代、果たしてそれでいいのか、とは感じますよね。
もう1つ難しいと感じるのは、品質の調整をどこまでやるべきかです。家電製品で考えてみましょう。
価格が一定でも品質が上がったら、安くなったと消費者は受け止めますよね。実際にそういう計算をしています。
ただ、品質が上がった分、商品の価格も一定程度上がるので、お金を払う側からすると、価格が安いものが手に入らなくなるわけなので、生活実感としてはむしろ懐が厳しくなっていくと考えられます。
つまり、現在の物価統計は生活費ベースで考えられているわけではありませんから、それを元に政策を考えるのは、果たしてどうなんだろうとは思います。
日本の女性就業率はアメリカより高い!
(松本)政策決定の現場で使われる公的統計は、つくるプロセスで起きている大きな変化に対応できていない、という問題があることが分かりました。
ただ、そういう変化が起きていますよという現場感覚を、政策決定者に伝える人が、いないのではないでしょうか。
(鈴木)日銀や内閣府には日銀エコノミスト、官庁エコノミストと呼ばれる人がいます。彼らは統計を作る側ではなく、「分析」するのが仕事です。
エコノミストが論文を書けば当然発表者の名前が残るんですが、統計については、それを作った人の名前が残らないんです。そういう意味でも、あわよくば大学教授に、なんて考えている人はエコノミストになりたがる(笑)。
そうなると、統計部門は人気という意味では劣ってしまいます。優秀な人はやはり人気のある分野に集中するので、統計部門や従事している職員の評価が高まらないという結果になりがちです。
海外だと統計ひと筋30年みたいない方がいらっしゃる。また、この統計はこういう風に変更しましたという文書には、ちゃんと個人名も掲載されます。
(松本)どういう過程を経て公的統計が作られたのか、ちゃんと知っている人に容易にたどり着けるわけですね。
そういう事情を知ると、いまの日本の公的統計に関する状況って、かなりやばいですよね。
顔が見えない。責任が持てない、取れない、だから何かあっても無かったこととして隠蔽するか、計算間違いでしたといってとぼけるしかない。
ただ、じゃあ実際に多くの人たち問題意識が持てるかというと、なかなか難しいのが現状でしょう。国民には直接的に影響ありませんから。せめてマスコミの人は注目してほしいなあと思ったりもするのです。鈴木さんはどういうところにまず問題意識を持つべきだと思われますか?
(鈴木)この本(『データサイエンス「超」入門』)にもありますが、まずは「疑う」というところから始めるべきだと思います。先週、行動経済学のセミナーを行ったのですが、人間って条件反射的に、それっぽいものに飛びついてしまうんですよ。
公的統計を扱うのであれば、政府統計にしろ、日銀統計にしろ、作り方や定義などの情報はだいたい公表されています。こういう情報はまず確認したほうが良いと思います。
たとえば、日本の女性就業率は7割で、実はアメリカよりも高いんです。
ただこれには「裏」があって、定義を確認すると、日本ではたとえ1時間だけのバイトや、育休・産休期間中でも、「就業」とみなしています。こういうことは、統計の定義をみないと分からないんです。
(松本)この本を書いているときも、定義って大事だなと思いました。データの裏側、定義の部分をちゃんと理解しておかないといけないと思います。
(鈴木)インターネットの進化が「いいなあ」と思うのは、官庁のサイトへ行けば大体は公的統計の資料が見られるようになったことです。20年前は紙の冊子しかなかったのです。そういう意味で、統計のリテラシーを高めやすい時代になったと思います。
(松本)最後になりますが、データを読む力を養うために、今日、明日からできることは何でしょうか?
(鈴木)繰り返しになりますが、数字の定義なり意味なりを、確認したほうがいいと思います。さっきの女性就業率の話が典型だとおもいますが、定義次第でデータの意味は全く変わってしまうんですよ。
あとは、データが手に入るなら、今はエクセルで簡単に折れ線グラフや散布図にできますので、そういう方法でデータの癖を見てみるのも重要だと思います。
(2018年12月05日「毎日メディアカフェ」講演会『データでニュースを読みとく「データジャーナリズム」って何?』より)
松本健太郎(まつもと・けんたろう)
1984年生まれ。データサイエンティスト。
龍谷大学法学部卒業後、データサイエンスの重要性を痛感し、多摩大学大学院で統計学・データサイエンスを〝学び直し〟。デジタルマーケティングや消費者インサイトの分析業務を中心にさまざまなデータ分析を担当するほか、日経ビジネスオンライン、ITmedia、週刊東洋経済など各種媒体にAI・データサイエンス・マーケティングに関する記事を執筆、テレビ番組の企画出演も多数。SNSを通じた情報発信には定評があり、noteで活躍しているオピニオンリーダーの知見をシェアする「日経COMEMO」メンバーとしても活躍中。
著書に『誤解だらけの人工知能』『なぜ「つい買ってしまう」のか』(光文社新書) 『データサイエンス「超」入門』(毎日新聞出版)『グラフをつくる前に読む本』(技術評論社)など多数。
鈴木 卓実(すずき・たくみ)
たくみ総合研究所代表、エコノミスト。睡眠健康指導士。
1979年、新潟生まれ仙台育ち。仙台育英学園高等学校出身。地元での仮面浪人を経て、慶應義塾大学総合政策学部に進学。2003年、卒業。日本銀行に入行後は、産業調査や金融機関モニタリング、統計作成等に従事。2018年より現職。経済家庭教師や各種セミナー(個人向け、企業向け)、経済・金融や健康リテラシー向上のための執筆、アドバイザーなどを通じて情報発信を行う。ITmediaビジネスオンラインにて「ガンダム経済学」、楽天証券トウシルにて「数字で分かる。経済ことはじめ」を連載。