logo

今なら間に合う!
サラリーマンに必要なデータサイエンスって?~データの取得からAI活用まで~

データは手元にある。だが、それでどうする?

 デジタルトランスフォーメーションの取り組みが進む中、多くの企業が「データ活用」という古くて新しい問題に頭を悩ませている。データを収集するための手段はIoTの進化によって以前に比べて格段に選択肢が増加した。センサーやネットワークなどのインフラを揃えても数万円からスタート可能だ。クラウドサービスを活用すればデータを蓄積・分析する基盤も比較的安価に構築できる。

 しかしながら、「データは手元にある。だが、それでどうする?」そんな状態で足踏みを続けている企業が多いのが現実だろう。そのような状況で企業担当者の間で好評を博している講座がある。題して「サラリーマンのためのデータサイエンス基礎講座」だ。

求められるのはサラリーマン向けのデータサイエンス


加藤大己氏
富士通クラウドテクノロジーズ
営業マーケティング本部
デジタルIoTソリューション部
プランナー

 「データサイエンスの学びの場は二極化していると思います。一方では、学術的な内容に偏りすぎて理解が難しい。もう一方では一般的な内容に偏り過ぎてビジネスの現場で使えない。蓄積しているデータを分析しようという段になって、ちょうどよいガイドがないことに気づくのです」

 そう話すのは、富士通クラウドテクノロジーズ(FJCT)のデジタルIoTソリューション部プランナー、加藤大己氏だ。FJCTは、クラウドサービス「ニフクラ」(旧・ニフティクラウド)や、企業のIoT支援を行う「IoTデザインセンター」などの企業向けサービスを展開することで知られる。

 加藤氏は、IoTデザインセンター立ち上げ後まもない頃から参画し、メーカーやサービス業のIoT/AI事業創出を支援してきた。さまざまなプロジェクトに携わるなかで、データ活用の現場で多くの担当者がデータサイエンスにどう取り組むかに悩む姿を見てきたという。

 「データサイエンティストに求められるスキルセットは3つあると言われています。背景課題を理解したうえで、ビジネス課題を整理し、解決する『ビジネス力』。情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う『データサイエンス力』。データサイエンスを意味あるかたちに使えるようにし、実装・運用できるようにする『データエンジニアリング力』の3つです。これらをバランス良くそろえることは現実的には難しく、それが理解の二極化にもつながっています」(加藤氏)

 よくあるのは、経営層から「IoTで何かやれ」「AIで何かやれ」と言われたが、どこから手を着けていいかわからないというケースだろう。ビジネス的なメリットは理解しているが、実現方法がわからない。ITの専門家に聞くと「BI、NoSQL、R、python」といった専門用語で説明をされ、それをどう現場で使うかわからない。データの専門家に聞くと「3をかけて25で割ればうまくいく」といった説明を受け、どうしてその答えになるのか理由がわからない。

 「今求められるのは『サラリーマン向けのデータサイエンス』です。ITやデータサイエンティストのコトバを理解し、現場の人間がきちんと手を動かしながらPDCAサイクルをまわせるようにする。そのために開設したのがデータサイエンス基礎講座です」(加藤氏)


データサイエンス基礎講座の様子

「ビジネス力」と「データサイエンス力」にフォーカス


高橋佑典氏
富士通クラウドテクノロジーズ
営業マーケティング本部
デジタルIoTソリューション部
データサイエンティスト

 講座を担当するのは、FJCTで実際に顧客の取り組みを支援している"現役"のデータサイエンティストだ。FJCTのデータサイエンティストは、データ分析を行うだけでなく、顧客を訪問してその顧客特有の課題をヒアリングし、ビジネス課題の解決に必要な提案も行うことが特徴の1つだ。

 基礎講座の講師を務めるデジタルIoTソリューション部のデータサイエンティスト、高橋佑典氏は講座の内容についてこう話す。

 「基礎講座は、データサイエンティストに求められる3つのスキルセットのうち、特にビジネス力とデータサイエンス力が重なる部分にフォーカスしています。実際の企業のプロジェクトでは、企業内にデータサイエンティスト人材を置くことは難しく、外部のパートナーと協力して取り組みを進めるケースが多くなると思います。そのときにデータサイエンティストが何をどう分析しているのか、何を考えてその結果を導いたのかをしっかりと理解できるようにします」

 講座は3部構成で、基礎から実践までを丸1日かけて学んでいく。第1部のテーマは「データサイエンスの歴史と全体像」だ。AIのトレンドや、よくある誤解、AI・機械学習・ディープラーニングの違い、機械学習を活用するためのフロー、データの評価方法など約120分で学ぶ。

 例えば、データ活用のフローでは「課題設定」「データ取得」「前処理」「学習手法」「学習」「検証」「再学習」「改善サイクル」という8つの項目のフローを解説し、それぞれで気をつけるべきポイントを習得していく。

 「AIプロジェクトなどを担当した方がよく驚かれるのが、前処理にかかる工数の多さです。データの前処理は、データに"抜け"や"重複"がないか、分析しやすいかたちで整理されているかを調査し、必要な加工を施す処理のことですが、この前処理はリソース全体のおよそ8割を占めます。実際のプロジェクトでも『こんなにかかるとは思わなかった』とおっしゃる方は少なくありません。あらかじめ学んでおくことで、準備がしやすくなります」(高橋氏)

提供:富士通クラウドテクノロジーズ株式会社
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2018年6月30日