データサイエンティストの仕事術「真の課題解決のためのアプローチ」

データサイエンティスト

業界のハイパフォーマーの方々をゲストに迎え、成果を生み出す仕事への取り組み方や考え方をお聞きする “職種紹介ADVANCE” の動画連載企画(本ページはその書き起こし版です。動画は本ページの末尾よりご覧いただけます)。
今回は、株式会社JDSC DXソリューション事業部より、VP of Data Scienceの中橋さんと、データサイエンティストの安川さんに『データサイエンス領域の課題の捉え方』というテーマでお話を聞いていきます。
インタビュアー:タリスマン株式会社代表:盛内文雄

-メディア運営-
Talisman Corporation / IT・外資の転職はタリスマン
外資系企業や日系大手、ベンチャー企業への転職にご興味のある方はぜひお問い合わせください。転職エージェントとして10年以上の経験、データを持つ弊社タリスマン株式会社がサポートさせていただきます。[厚生労働大臣許可番号] 01-ユ-300282

お二人の経歴について

ーー 早速ですが、お二人の自己紹介をお願いします
株式会社JDSC中橋良信
中橋良信さん(以下、中橋):株式会社JDSCのDXソリューション事業部に所属しております中橋と申します。簡単に自己紹介させていただきますと、私はもともと大学では遺伝育種学だとか統計遺伝学と呼ばれるような領域で研究をしておりまして就職後は、いわゆるデータサイエンティストとして、コンサルティングファームなどでビジネス課題の分析に携わってきました。JDSCには2022年から参画し2023年からは、VP of Data Scienceを務めています。

JDSC安川武彦
安川武彦さん(以下、安川):皆さんこんにちは。私もJDSCでデータサイエンティストをしております。専門は計算機統計というあまりなじみのない分野かもしれませんが、特に一般化線形モデルの拡張と母数の統計的性質に興味を持って今でも、休みの日にコツコツと研究をしてます。仕事はこれまで証券アナリストであるとかフィナンシャルエンジニア研究職、リスクコンサルタント、データサイエンティストという形で多岐に渡っているんですが、基本的には数理科学を、どう実務界に適用するか、実用化するかということに関心を持ってこれまでやっております。どうぞよろしくお願いいたします

データへの向き合い方

ーー JDSCさんは、東京大学発の日本データサイエンス研究所を前身とし、AI・データサイエンスを中心に業界変革を進める企業ということで、今日はよりインパクトを出せるデータの捉え方について一歩踏み込んだお話を聞けるのではないかと思い楽しみにしてきました。早速なんですが、最初の質問です。お二人とも日頃からいろんなデータを扱っていると思いますけれどもデータへの向き合い方について何か心がけていることなどありますでしょうか? 
中橋:ありがとうございます。データへの向き合い方というところを聞かれていて、いきなり話の腰を折ってしまうようではあるんですけれども「データと向き合うためには、まずは準備が必要」っていうところが、我々が心がけているところになるかなと思います。何かというと、まずそもそも我々みたいないわゆるデータサイエンティストというような職業は「分析をすることで価値を出していくもの」というふうに世間的には認識されているんじゃなかろうかと思います。 一方で、そもそも世の中には解くべき価値のある問いもあれば、そうではないものもあるということを認識する必要があるかなと思っておりまして、そういった解くべき価値のないものに対して一生懸命に時間を費やしたり、頭を使っても価値というものは生まれない、「あまり意味がなかったよね」、というような結果に陥りがちです。

あるいは、せっかく課題そのものには価値があるようなものであっても問いの立て方というものを誤ることでうまく価値につなげていくことができないケースもあったりします。つまり何が言いたいかというとインパクトのあるような分析を進めていくためには、そもそもその分析自体に価値があるものなのかを考えたり、どうやったら価値を引き出すような問いを立てることができるのか、そういった分析に入る前の準備が大事なんだよ、ということを申し上げたかったところになります。
なので、データを見る前にはそもそもこのデータをなぜ見る必要があるのか、というところを考えていくというのが我々の仕事の進め方になります。

ーー なるほどですね、ありがとうございます。安川さんは、いかがでしょうか?
安川:私はまた別な観点からお話しさせていただきます。私の恩師がよく「データに対して謙虚になりなさい」ということを言われました。当時は「何言ってんだよ」と意味があまりわかんなかったんですけれども、実際に実務界でデータを扱って分析をしたりいろいろなプロジェクトを見ていく中でデータだけではなくて、その背後にあるメカニズムであるとかデータが生成されるプロセスみたいなものをしっかりと考えるということが恩師が言っていた「謙虚であれ」ということなのかなと。
そのためには今、中橋さんが申し上げたようにデータだけではなくて、なぜそのデータがそこにあるのか、どうやってそのデータが生成されたんだろうか、というところを見つけるための問いかけが必要なのかなというふうに思っています。

ドメイン知識と背景情報

ーー なるほど、まずイシューを見極めるんですね。そこからデータサイエンティストの仕事が始まっているのは知りませんでした
中橋:そうですね、データサイエンティストといえば、例えば、何かしらを予測するためのモデルを作っていくっていうようなイメージを持たれているかなというふうに思います。一方で、その予測モデルを構築する上で何が重要かといいますと、その問題を考えたり、解決するために必要な情報であったり、あるいはデータを利用できるかというところになります。その情報やデータを整理していくために必要な能力が何かというと、問題を構造的に捉えて、必要な情報を整理したりあるいは、解決するための有効な仮説を生み出すといったソフトスキルであったりします。あるいは、その業界や問題に対する深い知識、いわゆる「ドメイン知識」というものも役に立ってきます。
安川:そもそも論でいくと「データというのは最初からそこにあるものではない」、我々が何らかの操作をして生み出されたものだということを理解するのが重要だと思ってます。最近では購買履歴であるとか、いろんなセンサーのデータであるとか何かを測定してデータを得るということに対するハードルがすごく低くなっていると思います。一方で、そのデータというのは数字だけではなくて背景知識、そのデータが生み出された背景情報も含めて数字じゃなくてデータ、ということになると思いますので、我々は見ようとしているデータっていうのはどんな背景を持って、どんな経緯を持って得られたのか、そういった構造を置き去りにしないで眺めていくということが重要なのかなと思っております。
中橋:もちろん、所与のデータから分析をするなと言いたいわけではありません。我々もそうですけれども、いろいろな事情によってデータを新しく集めることが難しく、今手元にあるデータから進めざるを得ないというような状況も多くあることかな、というふうに思っております。
ただ、大事なことはそういった一部のデータが取得できないようなときに新しくどのような仮説が必要となるだろうか、とかあるいは、この仮定が成立しなくなるだろうかとか、そういった仮説、仮定に対して意識的であれというようなところが申し上げたかったことになります。そのためには、繰り返しになるんですけれども現象について深く考えて、その仮定が成り立たないときには、どこにどんなふうに影響が出てくるんだろうかっていうことを検討する。そういったドメイン知識が必要となってくるのではないかなと思っています。

具体的な取組事例について

ーー 何か具体的な例などでお話ししていただけることってありますでしょうか?
安川:私の過去のクライアントの話なので、あんまり詳しい話はできないんですけれども、課題認識が、いかに重要かという例を一つ挙げさせていただきたいと思います。
そのクライアントは製造業で、「製品の出荷予測を当てたい。それがなかなか精度が上がらない」という課題感を持っていて、モデルを作ってくれというようなオーダーをいただきました。これをそのまま「予測モデルを作りましょうか」っていう風にできたことはできたんですが、ちょっと一歩遡って、「なぜそれって上がらないんですか?」「データが出てくる背景ってどんなものなんですか?」っていうことを最初に調査しました。そうすると出荷予測が当たらない、その背景には実は、予算を作る部門と販売する部門、それと製造・生産計画を立てる部門で、異なったインセンティブを持っていて、例えば販社部門であれば「お客さんに遅滞なく商品を届けたい」、製造部門であれば「計画通りにそのまま作りたい」というようなちょっと複雑なインセンティブ構造になっていました。そういった中で出てきた数字から予測して何の意味があるんでしょうかというところをさんざん議論しました。結局ここでやりたかったことは、その製品を買ってくれるお客さん(カスタマー)のマーケット自体がどういうふうに動いていくかっていうことを知るための予測で、そうすると社内のインセンティブ構造で歪められたデータをいくら分析して予測をしても、それは歪んだインセンティブ構造を表現するモデルにしかならないわけです。
じゃあどうしましょうか、ということでこの場合には予測モデルをまず作るのではなく、本来知りたかったデータを得るために各部門のインセンティブ構造をもう一回整理をしなおした上で適切なデータを収集して、それによってモデルで表現しましょうという形で一つの予測モデルを作るというプロジェクトが業務改善、業務オペレーションの変革みたいなところまで含めて取り組んだ事例となります。
ーー ありがとうございます。中橋さんは、いかがでしょうか
中橋:私からも具体的な例をひとつ出そうかなと思います。私は今、製造業のクライアントさんと、お仕事をさせていただいております。実はこの取り組みはですね、過去に別のAIベンチャーさんと組んで失敗したものを我々がリカバリーしているものとなります。そのAIベンチャーさんはですね、ある数値、具体的には価格なんですけれども価格を予測しようとした時に、今手元にあってすぐに利用できるような情報・データを使って予測モデルを作ろうとしたそうです。しかし、これは冒頭でも申し上げたとおり大きな誤りだというふうに思っていて、本来であれば、この価格というものは、どのような要素によって構成されるのか、どのような要因に影響を受けるのか、ということを考えたいと思われるんじゃないかと思うんですけれども、そのベンチャーさんは必要なデータをつまびらかにしないままに、y=f(x)というようなモデルを作ってしまった。
そういったことが失敗の背景にありました。クライアント企業さんとしては、その取り組み自体は失敗に終わった、というような受け止められ方をされていて、一方でやりたかったこと自体は価値のあることなのでそこを何とかできないだろうかというご相談いただきまして、我々だったらこのようにする、具体的には価格がどのような影響を受けているんだろうかっていうところの影響の大きさを調査するというようなところから始め、「価格に対して影響する要因はこれとこれとこれがある」、だから、「予測モデルを作るためにはこういったデータが必要だ」、でも、「このデータは今手元にない。じゃあここは作りに行こう」あるいは、「今手元にあるデータで予測モデルを作るとこの辺の影響をちょっと考慮することができない」、そういった議論をしながら、予測モデルの精度を高めていこう、というような取り組みを、今しているところになります。
このように、良いモデルを作ろうと思うとそもそも現象に対する深い理解、今回の場合だと「価格の決定メカニズム」というところになるんですけれども、そういった現象に対する深い理解というものが必要で、単にデータサイエンスの技術を当てはめれば高い精度が得られるっていうのは強い言い方をすると『幻想』なんだろうなというふうに思っております。
我々は、そういったより高い解像度を持って構造を理解するというようなレベルから問題を考えたい、というような集団であると自負してます。

ニュートラルな立場でデータとコミュニケーションを取る

ーー ありがとうございます。今、「幻想」という言葉がありましたけれども、安川さんが冒頭でおっしゃっていた「データに対して謙虚であれ」というのと通じるような気がしますけれども、そういうことでしょうか?
安川:はい、私もそう思います。AI技術とかデータサイエンスの技術っていうのは「過信するのも軽視するのも良くない」その上でニュートラルな立場でデータとコミュニケーションを取るっていうのが我々の考え方ということになってます。実際にデータにはないような情報を技術と力でひねり出して「あれ、おかしいな」と思うような例というのも学術論文を含めて、たまに見ることがありますので、ここはちょっと常に気を留めながら与えられたデータや与えられた問題に対して適切かどうかっていう問いかけを初期の段階でしっかりするというのが正しい姿なのかなと、謙虚な態度で挑むっていうことなのかなというふうに思ってます。

JDSCが考えるデータサイエンティストの立ち位置

ーー 次に、一般的なプロジェクトにおけるデータサイエンティストの立ち位置や業務の捉え方、(JDSCが他社と比べて)特徴的な部分についてお伺いしたいと思うんですが
安川:他社さんも一生懸命頑張っておりますし、我々の会社だけではなくてデータサイエンスっていうこの業界自体を日本でちゃんと広めていって、みんなで切磋琢磨してお互いにいい競争ができたらいいなというふうに思ってます。それぞれ考え方があるので、他社と比べてどうかというのは、あまり品の良い態度ではないかなと思いますので、そこを強調するというよりは、我々がどういうスタンスで取り組んでいるか、我々の哲学は何かということを理解いただくのがいいのかなと思ってます。
我々は社会課題の解決を目指しておりますので必然的に、目の前の仮説ではなくて仮説自体を質の高いものにブラッシュアップしていくという点、さらに、その仮説に基づいて、いろんなモデルであるとかプロダクトっていうのを開発していく点に力点を置くようなアプローチとなっております。
ですので、分析やモデリングだけではなくてその前工程や分析設計、仮説生成を含めてさらにモデルを作って解決するっていう後工程、これを接続するような位置づけとしてデータサイエンスを捉えているということになります。
JDSCが考えるデータサイエンティストの位置付け
そうすると、モデルを作っておしまいということではなくて、モデルを使い続けていくであるとか社会で活用し続けるというような視点が求められますので、「良いものができた、こんなに精度が高いんだ」っていうのが終わりではなくて、それが「どれだけ使い続けられて生き延びていますか」っていうところが、我々が力点を置きたいなと思っているところになります。

「SOTAな手法」よりも「枯れた技術」

中橋:私も安川さんのコメントに同意見で、私自身が同僚や、採用時の面談において候補者様に対してお話ししている内容でもあるんですけども、まず大前提、我々は分析の手法にフォーカスをしたり『SOTAな手法』を追いかけるようなチームではない。それよりもむしろ、いろいろな領域で応用されていたり教科書でまとめられているようないわゆる『枯れた技術』を好むようなチームである。そういった枯れた技術を、解きたい問題に対してそのまま適用するというよりも、それぞれの領域の課題に合わせてうまく技術を組み合わせながら問題を解決していきたいね、というようなことをよく話しています。
ーー すみません、ちょっと耳慣れない言葉が出てきたので解説していただきたいのですけれども「SOTAな手法」というのはどういうものでしょうか?
中橋:SOTAな手法、この「SOTA」というものは英語で State-of-the-Art から来ているんですけれども、要は先進的な手法を指す言葉になります。機械学習においては、自分たちが提案している手法がどれだけ優れているかということを示すためにいろいろな指標・数値でもって、比較・ベンチマークする、というようなことがあるんですけれども、その中でも、ある時点において一番スコアが高いような手法を指してSOTAな手法と言ったりいたします。また、途中で「枯れた技術」っていうような言い方をしてしまったんですけれども、これは「枯れた」という言葉は、もしかしたら少しネガティブに聞こえるかもしれないんですけども、意味としては全く逆で、「いろいろな領域、場面でよく使われて洗練されて実用的であるような手法」を指しています。
LLMなんかは良い例ですね。ChatGPTをはじめとするようないわゆるLLMというものは非常に便利なツールで、私もコーディングの際によく利用しているんですけれども、一方でツールとしての特性を考えるとどうしても利用を避けたい場面というものがあったりします。そのようなときに「LLMが駄目だから解決できない」ではなくて自然言語処理における古典的な手法を組み合わせながら問題を解決する道筋を考える、ということができたらいいなと考えています。

達成感が得られるのは?

ーー 次はマインド面についてもお話をお聞きしたいと思っているんですけれども、お二人が達成感を感じること、または直近で達成感を得たことなどありますでしょうか?
安川:中橋さん、どうですか?(笑)
中橋:(笑)これはなかなか難しい質問だなというふうに思っております。というのも、私が今まで課題解決のためにデータ分析をしてきた、プロジェクトとして取り組んできた中ではどちらかというと最後までやり切った、いいモデルを作れたなと満足できることの方が少なくてですね。 
どちらかと言えば、その期間の中ではここまでしか分析できない、やりきれずに終わってしまったな…と感じるところの方が多いので、なかなかこう達成感(よりも)・・・「もっとできるぞ!」っていう気持ちの方が強いですね。

データサイエンティストは欲深い!?

安川:そうですね。達成感を得たいなと思って、これまでやってきてはいますが、いつまでたっても得られないというか、データサイエンティストって結構欲深いんですね。
いいモデルを作ったら「もっと良いものができるはずじゃないか」と思ってしまう。で、さらに良いモデルができても、それがずっと続くモデルかどうか、真価が発揮されるのはモデルを使い続けた後になるので、そこまで我々は見きれない。見きれたとしても時間がかかるというようなことが多いですですが、我々がやっているところは、最終的にデータサイエンスを使って社会課題の解決をしていきたいと、その社会課題が解決されて「なんか変わったよね」「JDSCがやったことで少し業界が変わったよね」というようなことが言われたら、やってよかったな、達成感があるなと思えるのかなと。そこを目指していきたいですね。

現在チャレンジしていること

ーー 今業務やプライベートでチャレンジしていることとか、どのような思いでそれに取り組んでいるか、みたいなところをお伺いしてもよろしいでしょうか?
中橋:私はそもそも、バックグラウンドとして、先ほど統計遺伝というような言い方をしたんですけれども農業や畜産という領域で研究してきたということもあるので、自分が研究していたテーマに近い領域で貢献したいなと思っています。色々と「こういうことができるんじゃないか」っていうアイディアがあるので、日々の業務に取り組みつつもそういったアイディアを具体化するためにどうしたらいいのかとか、何ができるだろうかっていうことを考えています。
特に直近では、母校で客員研究員の籍をいただくことができ、先生から関心のあったテーマに関するデータをいただいて研究を進める準備ができましたのでまずは自分の関心のある領域で研究を進めていくというところが目標となります。
ーー 安川さん いかがでしょうか?
安川:仕事でいうと、我々のようなベンチャーっていうのは常にチャレンジしていかないと存在価値がなかなか見出せないところがあるので、仕事では常にみんなに「チャレンジしろよ」って言ってる分だけ自分も仕事にチャレンジしなきゃね、っていう風に思ってます(笑)。 個人的には、ライフワークとして研究活動をしてます。すでに鬼籍に入った先輩や恩師から引き継いで、まだ解けてない宿題がありますので、これはいつか解けるように頑張りたいなと思ってますが、なかなか難しい問題なので、時間はかかるなというところで、まだまだチャレンジは続くような状態です。
あと、データサイエンス業界についてはもっと発展させていきたいなという思いがあります。データ原理主義というか、データから学習すれば全て解決するみたいな、そういった考え方もあるのかもしれませんがそれは多分事実ではないので、そういった勘違いから解放されて、きちんと人間の仮説なり概念モデルと、データが結びついて良いソリューションが作っていけたらな、という風に思っております。

後輩たちへのアドバイス

ーー 今、データサイエンティストをしている方とか、これから目指す方にアドバイスなどあれば教えていただきたいと思っています
安川:データサイエンティストという名前の通りに皆さん生きてくださいっていうのがお願いです。データサイエンティストって言ってるので、サイエンティストですから「サイエンスとは何か」自分の言葉で語ってくれると嬉しい。データサイエンス界隈では予備知識を必要とせずに、先ほども申し上げましたけども、とにかく大量データを投入してデータに語らせればいろんな問題を解決できるんだっていうような流儀と、きちっと前提条件なりモデルを人間に解釈可能な形で定式化をして、データと加えて利用しようという、そういった流儀の2つが存在してるのかなと。我々はどちらかというと後者側でドメイン知識とか、不足している情報を予備知識であるとかデータでうまく埋め込んで補完しながらやっていくようなアプローチ。こちらを志向していきたいなというのが我々のスタンスです。もしこういった思想や流儀に共感していただける方がいたら是非一緒にやりたいなと思っておりますし、データサイエンティストを目指される方は会社ごとにいろんなスタンスなり哲学っていうのがあると思いますので、ぜひそこを募集や面談の時に聞いていただいて、ご自身の志向に合った会社を選ばれるとよろしいのかなと思います。

採用情報と求める人物像

ーー ありがとうございます。最後に、JDSCさんでは現在データサイエンティストやその他職種でも積極的に採用中ということで、この辺の詳細も教えていただけますでしょうか?
中橋:はい、ありがとうございます。JDSCは、データサイエンスを用いて問題を解決し、業界や社会全体をUPGRADEすることをミッションとしているような会社です。データサイエンスという手法にこだわりつつも手段だけではなくて、課題解決に強いご関心を抱いているような方であれば、きっと弊社にフィットするんじゃないのかなと思いますので、そういった方のご応募をお待ちしております!

本インタビューの動画版を以下よりご視聴いただけます

タリスマン株式会社代表 盛内文雄
インタビューを終えて
タリスマン株式会社代表 盛内文雄


東大発、AI・データサイエンスの技術力に、ビジネスの知見をかけ合わせることで、日本産業全体に網をかけるように業界変革を進める注目の企業、株式会社JDSCのデータサイエンティストお二人にお話をうかがいました。アカデミックな領域にも軸足を置きつつ、その社会実装に本気で取り組んでいる姿勢が伝わってきて、お話を聞いてるこちら側の背筋が伸びるような時間でした。
洗練された、スマートなイメージがあるデータサイエンティストの仕事ですが、ひたむきにデータとその背景に向き合う人間が介在してこそ、成果につながるということがよく理解できました。

タリスマンに転職相談をする

いますぐ求人を探す



Talisman編集部

最新の転職市場、キャリアアドバイスの他、効率的な働き方やビジネス英語等のスキルアップに向けた旬な情報をお届けします。

コーポレートサイト
talisman-corporation.com/ja/

Linked In
@talisman-corporation

Facebook
@talisman.recruitment

YouTube
@TalismanCorporation

Instagram:
@talisman__corporation

関連記事

  1. ITエンジニアがこだわりたいデスク周り

    作業効率アップで差をつけろ!ITエンジニアがこだわりたいデスク周り

  2. エンジニアに数学は必要か?その関係性と学び直しに有効な本を紹介

    エンジニアに数学は必要か?その関係性と学び直しに有効な本を紹介

  3. エンジニア必読!コミュニケーションを円滑にする本7選

  4. 日本のLinkedIn普及率が低い背景は?ユーザーができる有効活用法も解説

    日本のLinkedIn普及率が低い背景は?ユーザーができる有効活用法も解説

  5. ビジネス用語「オフショア開発」とは?重要な関連トピックも解説

    ビジネス用語「オフショア開発」とは?重要な関連トピックも解説

  6. エンジニアなら押さえておこう!オフショア開発フェーズの変遷と今後

    エンジニアなら押さえておこう!オフショア開発フェーズの変遷と今後

  7. エンジニアにおすすめ厳選12ツール!エンジニアを目指す人の武器にも

  8. 保守系システムエンジニアの仕事とは?運用との違いやメリットを紹介

    保守系システムエンジニアの仕事とは?運用との違いやメリットを紹介

  9. エンジニアがプログラミング言語のバイリンガルだと有利な理由とは

    エンジニアがプログラミング言語のバイリンガルだと有利な理由とは

SNS

PAGE TOP

ビジネスのプロフェッショナルをつなぎ、転職を成功に導く

スカウトを受ける