インドの大学と一緒にデータ分析してみました!

機械学習を使ったデータ分析への取組み

こんにちは。株式会社システムコンサルタントの国際・綜合企画部の久保木です。弊社インド開発センター(SCII)ではこれまでインドの研究機関、工科大学と連携して、新しい技術の利用可能性を考えるためのプロジェクトを行ってきました。本稿では現在私が担当しているプロジェクトをご紹介いたします。

インドはこれまで、世界中の企業を相手にオフショア開発サービスやコールセンター業務、総務的な作業の外部委託(BPO)などを提供してきました。近年、そうした状況に変化が見られるようになってきました。これまでの様な単純な業務の提供ではなく、新しい技術研究や、サービスの研究開発といった、より高度なレベルのサービスを提供する拠点へとその役割を変えてきています。現在は世界中の企業が研究開発センターを南インドのシリコンバレーと呼ばれるバンガロールに構えています。

さて、大学との共同プロジェクトに話題を移していきますが、今回連携する大学はインドのIT中心地であります、バンガロールに位置しているCambridgeという工科大学です。

今回共同で研究開発するプロジェクトのテーマは機械学習(Machine learning)を使ったデータ分析です。近年多くの企業が抱える課題としてBIGデータ分析が挙げられます。お客様からも「データだけは一杯あるのだけれど、どう活用したらいいかわからない」といった声が多くきかれます。また、データアナリストの育成が盛んに叫ばれていますが、業界ごとに異なる知識が必要とされるため、その育成は容易ではありません。そこで今回大学と共同して、そうした業界の知識を前提としない、機械学習を活用したデータ分析をプロジェクトのテーマとしました。これを応用することによって、ビジネスプロセスや製造過程で蓄積したデータを分析し、結果我々が想像し得ない全く新しい解を得ることが可能になります。

今回は大学との共同研究ということもあり、分析する対象データはその大学の学生情報になりました。「より良い会社へ就職できる学生」のパターンの発見を目的としています。これにより、今後のより良い大学カリキュラムのあり方や、学生指導の方法が見えてくることが期待できます。先日、大学にお願いをして、学生の履修内容、成績、課外活動の有無、趣味、自宅からの通学か寮生活か、その他120項目に上る情報をコンピュータサイエンス学部の学生約180人から集めてもらいました。それらのデータを整理して、データベース化した後に、クラスタリングを行っていきます。今後はより適したクラスタリングの方法を学生や教授陣と一緒に検討して行くことになります。

昨年の12月から大学側と打合せを重ね、様々な課題(担当教授の転職など)の課題を乗り越えながらようやく具体的に今後のマイルストーンをひくことが出来ました。インドという日本と異なる環境では、こちらが想定している通りに物事は進んでいきません。 普段私は日本人の方を対象としたグローバル人材育成研修を担当させて頂いていますが、文化の違う人とのプロジェクトの難しさを改めて実感する機会になっています。どうやってこちらがイメージしていること、期待していることを相手と正確に共有できるかがポイントなのだと思います。あせらず、あきらめずに進めていければと思っています。また状況をお伝えできればと思います。

最後まで読んでいただきありがとうございました。