2023-06-24
1.
前段
2.
第1章:データサイエンティストという仕事
3.
書籍情報
データ分析は、さまざまなシーンでビジネス効率を上げることに役立ちますが、企業内での定着に向けてはまだまだ課題が多いという実情があります。
その背景には、データ分析がビジネスで本当に達成可能なことの大枠を知らない。
つまり、そのような情報が少ない、ということに帰結しそうです。
そこで、本シリーズでは10回に分けて、『ビジネス活用事例で学ぶ データサイエンス入門 (SBクリエイティブ)』を通して、データ分析について事例を交えながらわかりやすく紹介していきたいと思います。
本書では、実際のビジネスのなかで「データ分析」を適切に行うことで何ができるのか、どういうふうに役に立たせることができるのかについて、基礎から応用までわかりやすく示されています。
既存のデータ分析についての書籍にはないような分析、かつ分析実務者である著者2人が実際に行なってきたケースを選んで解説しています。
データ分析に従事する人、また、データサイエンティストの仕事内応を理解し、データ分析者と上手に仕事を進めたい人の参考になれば幸いです。
今回の記事では、「第1章:データサイエンティストという仕事」について紹介します。
■データとは何か
古くから人は現実を観測し、その観測データを分析することで、さまざまなルールや法則を発見してきました。
たとえば、ドイツの天文学者ケプラーは、天体観測データから惑星が太陽を中心として楕円軌道を描くことを発見しています。
また統計の分野でも、フランスの数学者ド・モアブルは多くのゲームを観測し、正規分布の考え方の軸となる中心極限定理を法則としました。
過去の出来事を記録していくことで、現在起きている現象のなかに説明可能なルールを因果関係として見出し、それに基づいて現在の出来事から将来起こりうることを予測する。
こうした活動のなか、さまざまな領域でルールは発見され、吟味され、時には再検討されつつ、科学は進展してきました。
データとは、こうしたルール発見・検証の肝となる、貴重な材料なのです。
■データのビジネスへの応用
近年、WebあるいはPOS(pont of sale:販売時点管理)などの発達により、人の行動がデータとして簡単に蓄積できるようになりました。
この蓄積されたデータからルールを導くことができれば、従来からビジネスの世界で行われてきたある種の経験則を超えた科学的なデータ分析のもとに、新しくビジネスを展開できるのではないかと期待されるようになってきています。
また、実は皆さんも日々データ分析を活用していると言えます。
例えば、多くの人は定期的に体重計に乗ります。この時、体重の数値そのものに大きな意味はなく、あくまで体の重さの「観測データ」となります。この「観測データ」をもとに、
・理想とする健康的な体重を割り出し、目標値を設定する
・暴飲暴食などの過去の行動との過去の関連に気づき、反省する
・適切な運動や食生活をなどのデータから健康管理の行動の模倣を行う
などの判断をし、具体的な行動を選択することで、体重をコントロールしようとする人は多いのではないでしょうか。
ビジネスにおいても、このように観測したデータから因果関係を推測し、未来を予測する、あるいは、望ましい結果となるように原因をコントロールしていくという作業がさまざまなシーンで行われています。
最近では、これを行う専門職として、「データサイエンティスト」と呼ばれる人材を組織に置く企業が増えてきています。
■データサイエンティストが必要とされる背景
ビジネスにおいては、観測したデータから因果関係を推測する作業はかつてはマーケティング部、人で言えばマーケターと呼ばれている人が担当していました。
マーケティング部署の大きな目的は「ユーザーの気持ちを知り、それに合わせてビジネスを展開していく方針を示すこと」であり、具体的には、各種売上データの分析、広告や新製品に対する認知状況、販売中の商品に対する満足度などを目的としたアンケート調査の分析、あるいはカスタマーサポートへの問合せ分析、などを行なってきました。
しかしながら、情報技術の進展に伴いビジネス環境は変化し、各企業には大量のビジネスログが残せるようになりました。
これまでマーケティングで扱ってきたようなデータに加え、この大量のログを従来のマーケティングに組み込み、より素早い分析と細かな修正を繰り返し行い、よりスピーディーに顧客のニーズに適応させていくことが要求されるようになってきています。
つまり、近年のビジネス環境の変化にあわせ、従来なかった領域に多大な可能性と関心が生まれてきているのです。
この分析を行なっていくために必要なのは、ログデータを直接分析できる人、すなわち「コードが書けるマーケター」です。
コードが書けるマーケターは今、「データサイエンティスト」とも呼ばれています。
しかしながら、従来、マーケティングは主に技術系の人が行う職種ではなかったので、すぐには適任者が出てきていないのが現状です。
そこで現在、主に3つのキャリアからこの職務を達成しようとする動きがあります。
■ビジネスの領域からデータサイエンティストを目指す
ビジネス経験が長い人が、マーケティング活動に入っていくというキャリアパスでは、営業経験者であれば「売れる」ことの要因を経験上知っており、生産現場の経験者であれば、ユーザーニーズに対応した商品を作ることの具体的な困難さを知っています。
こうしたビジネスに長く関わっていた人の経験と、データ分析とは相反するものではなく、それぞれに対しての十分な理解のもとに、相性良く繋がれば、ビジネスに大きな効果をもたらします。
それまでの経験に即してデータの裏側にある背景を具体的に推測することが可能になるなど、データの解釈に実務経験からくる奥深さがありますし、また、実際のユーザーニーズを知るために必要なデータを発見し絞り込む力にたけています。
■統計学の領域からデータサイエンティストを目指す
計量経済学、遺伝子工学、物理学、人工知能研究などを専攻としながら、統計を道具として長く利用してきた人がマーケティング活動に入っていく場合、これらの経験者は、データの状態などから、どのような目的でどんな結果を出すためにどのようにデータ分析手法を使うとよいかを想定できたり、データの状態や処理の目的にあわせて適切な統計手法を選択していくことが可能だったりします。
また、統計手法を実際に利用していくなかで、データ分析の限界や統計手法の利用方法に経験が蓄えられます。
■エンジニアリングの領域からデータサイエンティストを目指す
データサイエンティストの業務の大半を占めるのが、データの前処理、すなわち、分析のためのデータの整理です。
この部分の時間の短縮がそのままデータ分析の生産性につながりますが、うまくデータを整理するためには、うまくコードが書けるようになる必要があり、その習得にはコストがかかります。
■ビジネスの領域からデータサイエンティストを目指す
ビジネス経験が長い人が、マーケティング活動に入っていくというキャリアパスでは、営業経験者であれば「売れる」ことの要因を経験上知っており、生産現場の経験者であれば、ユーザーニーズに対応した商品を作ることの具体的な困難さを知っています。
こうしたビジネスに長く関わっていた人の経験と、データ分析とは相反するものではなく、それぞれに対しての十分な理解のもとに、相性良く繋がれば、ビジネスに大きな効果をもたらします。
それまでの経験に即してデータの裏側にある背景を具体的に推測することが可能になるなど、データの解釈に実務経験からくる奥深さがありますし、また、実際のユーザーニーズを知るために必要なデータを発見し絞り込む力にたけています。
■統計学の領域からデータサイエンティストを目指す
計量経済学、遺伝子工学、物理学、人工知能研究などを専攻としながら、統計を道具として長く利用してきた人がマーケティング活動に入っていく場合、これらの経験者は、データの状態などから、どのような目的でどんな結果を出すためにどのようにデータ分析手法を使うとよいかを想定できたり、データの状態や処理の目的にあわせて適切な統計手法を選択していくことが可能だったりします。
また、統計手法を実際に利用していくなかで、データ分析の限界や統計手法の利用方法に経験が蓄えられます。
■エンジニアリングの領域からデータサイエンティストを目指す
データサイエンティストの業務の大半を占めるのが、データの前処理、すなわち、分析のためのデータの整理です。
この部分の時間の短縮がそのままデータ分析の生産性につながりますが、うまくデータを整理するためには、うまくコードが書けるようになる必要があり、その習得にはコストがかかります。
ITエンジニアがマーケティング活動に入っていく場合は、このコードを書く力や、コンピュータをうまく動かすためのさまざまな知識を持っているので、どのようなコンピュータ言語や仕組み(システム)でデータを処理していけばよいかを想定しやすい傾向があります。
こうしたエンジニアからの分析者は、複雑化したデータを分析しやすくするために整理したり、言語や仕組みの選択をしたりする力にたけています。
上記で説明したように、3タイプのデータサイエンティストがいますが、現状ではどこかのキャリアを持っている人が特に強いということはありません。
ビジネスの理解、統計手法の理解、コードやシステムの理解と、それぞれに足りていない部分の取得に努めながら成長をつづけています。
そして、それぞれが足りていない経験や知識を埋めるため、互いに補完しあいながらマーケティング業務を遂行しています。
いかがでしたでしょうか?
次回は「ビジネスにおけるデータ分析フロー」をお送りします。