提 供
【わがスパコン人生】第10回 田村義保

究極の乱数ボードを作りたい
今でこそ「ビッグデータ」という言葉が広く浸透し、使われていますが、そのだいぶ以前から「ビッグデータ」を扱ってきた田村義保先生に、現代のビッグデータとAI時代をどう見ているのか、また先生が長年研究され、現代のネット社会においてもますます重要視される「乱数」について、お話をお聞きしました。
真にランダムな乱数を求めて
―小さい頃はどのようなお子さんでしたか?
父親が船員で神戸にいたときに生まれましたが、プロ野球の西本明和&聖選手の出身地でもある愛媛の興居島で3,4歳まで暮らし、それから高校を出るまでは神戸で過ごしました。小学生の頃から、どちらかというと文系の科目よりも理系の科目が好きでした。小学6年生の時の先生とも気が合って成績も悪くありませんでした。
ただ、中学生になると、勉強しなくても高校は入れるだろうという傲りから、勉強をしなくなってしまいました。幸い、中学2年生の時の先生が厳しい先生で、真面目に勉強するようになりました。
―先生と計算機との出会いを教えてください。
![]() |
|
計算道具との出会いは、まず小学校でそろばんと出会いましたが、あまり好きではありませんでした。中学2,3生の時に確か対数を習ったかと思います。その時に計算尺の原理も習い、計算尺を使うようになりました。それが計算の道具との最初の出会いです。
高校では実験が好きな先生が多かったので、物理実験で統計的処理は習いました。世界初のパーソナル電卓として知られる「カシオミニ」が出たのが1972年、私が大学生の時ですから、高校生になっても計算機はほとんど使ったことはありませんでした。ですから、ひたすら筆算の世界でしたね。私自身は筆算の方が速かったので、そろばんを使おうと思ったことはありませんでした。ただ、最小二乗法を紙で計算するというのはすごく疲れますね。誤差計算も全て紙、筆算でした。数学はすごく真面目に勉強しましたよ。
一番感謝しているのは高校の物理の先生です。東大の航空学科を出た先生でしたが、教科書を使って勉強したのは高校3年の1学期だけで、あとは全て実験でした。試験問題も大学よりも考えるような問題を出してくれていました。前から物理は好きでしたが、ますます好きになりました。あの先生がいなかったら物理へ進んでいなかったかもしれません。
―大学進学後のことを教えてください。
高校卒業後は東京工業大学(東工大)の物理学科へ進みました。入学したのが1971年のことで、電卓が出始めてはいましたが、高くて買うことはできませんでした。ですので、1年生の実験では全て筆算か計算尺を使いました。2年生の時にはHP(ヒューレッド・パッカード)の関数電卓が物理実験の実験室にあって、使いたい人に貸し出すことはしていました。
物理の実験室に手廻し計算機の手廻しの部分がモーターになっている、押せば手廻しと同じことをやってくれる計算機があり、それで「1万÷3」をやって、助手に怒られたことを覚えています。1万÷3なんてやっちゃいけないんですよ。3333回も回転するから。途中で油の臭いがプーンと匂ってきました。古い計算機を使ったのは、確かそのモーター式の計算機が最初で、大学院に入ってから奨学金を使ってテキサス・インスルメンツの関数電卓を買いました。それが自分で買った最初の電卓です。
ドクター課程へ進んでから、HITAC M-200Hだったと思いますが東工大の汎用機を使いました。言語はFORTRANで、やっていたのは数学でいうと時間発展型の偏微分方程式の数値計算でした。私がドクターの頃は偏微分方程式を数値的に解くための教科書はありませんでした。今だったら有限要素法や他の方法があったと思いますが、陽解法で解こうとしましたが、結局うまくいきませんでした。境界条件のところで、誤差が貯まってどこかに発散してしまいましたが、修正の仕方が分かりませんでした。うまくいっていれば、良い論文にはなっていたと思いますが。それが一番先に大きい計算機が必要だった計算です。
―大学と大学院では順調に研究生活を送られたのでしょうか?
大学では結構真面目にやっていましたが、ドクターの1年生の後半から2年生の時に全くやる気がなくなってしまい、映画ばかり観に行っていました。年間で200回位は行ったんじゃないかな。あの頃は安く観られる映画館があったんですよ。その頃までは論文も書いていたけれど、とにかくやる気がなくなってしまい、医者にも何ヵ所かいきましたが、特にどこも悪くないと言われてしまいました。最後に行った病院では何をしているのか聞かれて「博士課程」だと答えたら、「それは大変だから、運動でもしたら治るよ」と軽く言ってくれました。それでジョギングや、研究室対抗で野球やサッカーをしていたら、次第に気分が晴れて勉強する気になりました。
ちょうどその頃、京都大学にアトム型研究員というのがあって行きました。それで雰囲気が変わったことも、やる気を取り戻したきっかけでした。アトム型へ行っていた時に、湯川秀樹先生が京大にいらっしゃって、研究室のみんなと食事へ行くことになったのですが、私はそれが決まる数分前に、別の人に誘われて外出してしまっていました。湯川先生と食事をすることで、得るものがあったかもしれないと思うと、非常に惜しいことをしてしまいました。湯川先生はその半年後位に亡くなられてしまい、結果としてその日が京大へ来た最後の日だったそうです。
―なぜ物理学部から統計数理研究所へ入られたのでしょうか?
![]() |
|
ドクター課程を修了後の1年目は良かったんです。日本学術振興会(JSPS)の奨励研究員になることができました。しかし、奨励研究員も今は3年間採用してくれますが、昔は1年ごとで、2年目はもう一度審査があり、落ちてしまいました。某物理系研究所の面接の不合格と、ふたついっぺんに同じ日、それもバレンタインデーの日に来たから気分は悪かったです。
経歴を空けることは良くないので、4月からは東工大の研究生になりました。職が欲しいから、掲示板を真面目に見ていたところ、5月くらいになぜ物理の掲示板に貼ってあったのかは分かりませんが、統計数理研究所(統数研)の公募の案内が貼り出してありました。赤池弘次先生は時系列解析で知られた方ですが、私はドクターの時に確立微分方程式の数値解法を研究していたので、できるんじゃないかと受けてみたところ、なぜだか採用して頂くことができ、1981年6月に面接を受けて翌7月から統数研に籍を移しました。
最初の3年は私が入る前年の1980年に導入されていたアイ電子測器製のAICOM-C6を使った視聴覚的情報検索システムをやりました。時系列解析をするためのデータを定常か非定常かを見るために、データをD/A変換して、音声として出力したり、オシロスコープの出力をグラフとして見ていました。
その後、助手から助教授となり、正式に計算機担当となりました。私が初めて調達したのが1989年のHITAC M682Hで、この時から私がほとんどの仕様書を書きました。1989年に初めて書いた仕様書は5枚だけというのどかな時代でした。今や100ページにもなりますからね。それから計算機を色々と入れてきました。4,5年に1回入れ替えていますが、だいたい速度は10倍になるのに電気代は変わりません。それは不思議ですが、節電機能ができているんですね。乱数発生器も計算機、メインフレームはスパコンを入れ替えるたびに入れています。
私が助教授になった当時も今も一般には疑似乱数が主に使われていますが、その周期性は大規模な計算をするには問題があり、物理乱数の方が良いのですが、物理乱数は発生速度が遅く、その高速化の研究をしました。統数研では1960年代から電気回路で発生させることをずっとやっています。私は以前の方法のボードと新しい方法のボードの両方を開発しました。
―今までで一番嬉しかった出来事とは?
乱数ボードを1989年から何世代か作れたことです。最初に日立と開発した1989年のものは速くはありませんでしたが、大学院を出てからまだ10年も経っていない時のものです。まだ大学の講義を覚えていて回路図が出来たのが嬉しかった。1999年の東芝製のランダムマスターは結構売れたんですよ。理化学研究所に異動した泰地真弘人さんが短い期間でもいてくれたのは、高速化に関して同意見で、相談する人がいたという意味でも恵まれていたと思います。
―先生は長年、乱数の研究を続けられていますが、私たちが一番恩恵を受けるのはどういったことでしょうか?また、何か印象に残っている出来事があれば教えてください。
皆さんの身近なものでは、銀行のワンタイムパスワードがあります。あれは乱数の発生方法が分かると、予測ができてしまいます。どう変わるか、自分でいくつか取って、次の数を予測して当ててしまった人がいました。自分のしかやっていないから違法行為ではないけれど、人のでやったらなりすましができてしまいます。予測できてしまっては、まずいわけです。研究が進むことで、それがより安全になります。
印象に残っている出来事は、清水良一先生が所長だった頃だから、1995年か96年頃だったと思いますが、セーターを編む方が「セーターの色をランダムにしたいから、乱数表をくれませんか?」と尋ねてきたので、差し上げました。私もお会いしましたが、色がランダムな模様を作りたいとおっしゃっていました。乱数表をどう使ったのかは知りませんが、完成したセーターはVOGUEという雑誌で、VOGUE賞がもらえたと。意外な利用方法で一番の宣伝効果でした(笑)。恐らくデザインというよりは、そういったアイディアでVOUGE賞をもらったのでしょう。
もうひとつ、インテルのXeonに物理乱数発生装置に入っていますが、公開されている回路図を見たら、私が以前、FDK株式会社と共同で開発して特許も取っている回路図とよく似ているんですよ。これはインテルから特許料をもらえるかもしれないと思いましたが、微妙に違いました。フリップフロップ回路の入力、出力を入れて、それがランダムに動くという原理は同じで、回路図が微妙に違っただけ。特許はもっと広く書くべきであると、ちょっと後悔をしました。
ビッグデータとAI時代をどう見るか
―統数研が設立された目的を教えてください。
統数研は統計の研究のため1944年6月5日に設立されました。戦時中のことです。イギリスがOR(Operation Research)を使って作戦を立てていると知って、確率や数学の研究が大事だということ、数学の研究所が必要だということで創られました。私が入った頃の所長の林知己夫先生は東大の理学部数学科を出た方ですが、戦時中はロケットの弾道計算をされていたこともあります。
戦後すぐは何をしていたかというと、日本人の言語能力の調査です。日本語は漢字が多くて難解なため識字率が上がらない、日本人は字が書けないとアメリカから思われていたようで、連合国軍最高司令官総司令部(GHQ)の日本人の識字率を調査する学者によって、日本語をローマ字に変更する提案がなされました。そこで統数研では、日本人の言語能力に関する社会調査を始めたわけです。調査を分析するには計算機が必要です。だから、今はビッグデータと言って、計算機は大事にされていますが、統数研では昔から当時のビッグデータを扱っていました。
―長年データサイエンスを研究されてきた田村先生は、今のAI時代をどう見ているのでしょうか?
![]() |
|
統計学者の中には統計学が上にあって、下にデータサイエンスがあるという人もいます。私はデータサイエンスが上にあり、そのひとつがAIで、ひとつが統計学という手法だと思っています。だから、統計的手法が大事なのではなく、AI的な情報学的な手法も大事で、両方をうまく使えれば良いのでしょうが、AIの人で良くないのは、それはどう考えても重回帰分析だろうという統計学上の分析をしておきながら、AIを使いましたというケースです。マスコミがAIと言ったほうがウケるから言っているのか、本人がそう言っているのかは分かりませんが、ブラックボックス的な解析はすべてAIになってしまっています。
学問の分野はなぜだか、どこまでがAIでどこまでが統計か分けたがる人がいますが、私は分ける必要はないと思っています。正直なところ、どこまでがAI的な手法で、どこまでが統計的な手法となるのか、その分類方法も分かりませんし、気にすることもないと思っています。
今は何でもビッグデータを使ってやりましたと言うけれど、それもおかしいだろうと思います。売上データを使いましたとか、もう少し細かく言った方が良いのではないでしょうか。ビッグデータもどれぐらいがビッグデータか。そもそも、ビッグデータの定義も実は総務省の定義と経産省の定義が微妙に違うんですよ。私が個人的にビッグデータで一番良い定義だと思ったのは、某先生が言われた「Excelで扱えない量がビッグデータ」です。メモリが多くてもExcelでは100万行くらいまでしか読めませんから。
今はスパコンもデータサイエンス、データ分析で使うような風潮になっていますが、助教授になったあと、計算機担当として多くの業者の方と会い、カタログもたくさんもらいましたが、彼らのカタログに記載されていたスパコンの使う目的は流体計算といったもので、「データ解析」「統計解析」とは書いてありませんでした。そこで、業者の方々に「データ解析」や「統計解析」と書くよう、1987,8年ころから提案をし続けていますが、未だに書いてもらっていません。書いてあれば、それなりに皆が注目したと思うのですが。
―統数研のような研究所は欧米にもあるのでしょうか?
同じような研究所は台湾とインドにしかないのではと思います。台湾、インド、日本は三機関で連携を結び、毎年ワークショップや研究会を持ち回りで行っています。アメリカは主に統計をやっている人が集まっているような研究所はありますが、大学の学部とその付属の研究所といった感じですよね。
アメリカは規模が大きい大学には生物統計学部や統計学部がありますが、日本には専門的に統計を教えている学部はありません。しかし、文科省がデータサイエンス教育を大事だと考え、北大、東大、京大 阪大、滋賀大、九大、この6大学を統計教育の拠点校として、きちんと学部教育をしようとしています。理系修士入学者レベルを1年間に5万人、統数研でも理研 革新知能統合研究(AIP)センターと共同で、業界を代表するような高度なデータサイエンティストを年間50人育てるための活動を行っています。
![]() |
|
―田村先生にとってスパコンとは?
研究に欠かせない道具ということですよね。それ以上でも、それ以下でもないという感じでしょうか。データ解析もやっていますが、私たちの主な目的と業務はデータ解析のための統計的手法を考えてプログラムにする、動くようにすることだと考えています。各分野の人のために新しいデータ解析手法を作るためには、やはり大きな解析をしないといけませんので、スパコンレベルの計算機がないとプログラムを作ることができません。小さいプログラムを作って、大きくすれば動くでしょという世界ではありません。
そういった意味ではスパコンがないと統計の研究、データサイエンスはこれからますますやっていけなくなるでしょう。それも、ただGPUがあればいいというわけではありません。大きいメモリが取れるスパコンが欲しいという思いがあります。速いことにこしたことはないですけれどね。だから、どうしてスパコンを止めてしまう研究所があるのか。統数研ではいつまでも欲しいですね。
スパコンの開発に関しても、自前の技術を持っておくべきです。全部アメリカ製ばかり使っていると、アメリカがダメだと言ったら、スパコンを使えなくなってしまいます。今更CPUを作るのは難しいかもしれませんが、インターコネクトだけでも自前にするとか。以前、小柳義夫先生がインドの研究所で講演をされたときに、インドは自前のインターコネクトを使っているので尋ねたら、「ひとつぐらい自前の技術を持っていないとまずいから」ということだったそうです。
日本も何か自前の技術を持っておかないといけません。しばらく作ることを止めてしまうと技術が継承しません。ジェット機がそのいい例じゃないですか。まだ飛んでいません。日本もずっとスパコンの開発を続けるべきです。
―今後やってみたいことはどのようなことでしょうか?
究極の乱数ボードを作りたいですね。疑似乱数と物理乱数を混ぜて、計算するというものはSGIやHPに作ってもらいました。それをもっと改良したいです。物理乱数の発生部分を見直し、今の疑似乱数ではなく光の方がいいに決まっていますから、改良しもっと速い乱数ボードを完成させたいです。それを誰か一緒に設計してくれる人がいたら嬉しいですね。
![]() |
田村義保氏 略歴 |
1975年 東京工業大学理学部物理学科卒業 1980年 東京工業大学大学院理工学研究科物理学専攻博士課程修了(理学博士) 1980年 日本学術振興会奨励研究員 1981年 統計数理研究所研究員 1985年 統計数理研究所助手 1986年 統計数理研究所助教授・総合研究大学院大学助教授(兼任1989年) 1997年 統計数理研究所教授・総合研究大学院大学教授(兼任) 1998年 統計数理研究所・技術課長(2000年まで) 2000年 統計数理研究所・統計計算開発センター長(2004年まで) 2004年 統計数理研究所・副所長(2010年まで) 2010年 統計数理研究所・データ科学研究系主幹(2011年まで) 2011年 統計数理研究所・副所長(2017年まで) 2017年 統計数理研究所・データ科学研究系主幹(2018年まで) 2018年 統計数理研究所 名誉教授・特任教授・総合研究大学院大学 名誉教授 2018年 独立行政法人統計センター 統計技術研究課 特別研究員 |
(写真:小西史一)
1件のコメントがあります
素人でも大変良くスパコン 計算機 の世界の事が分かりました。
田村義保氏の仕事の功績貢献歴史も合わせて大変良くわかりました。