X1039
データビジネス創造A
DATA BUSINESS CREATION A
特設科目
Special Seminars
1 単位
実施形態 完全オンライン
開催日程 秋学期 月曜日2時限
担当教員 植原 啓介:古谷 知之(ウエハラ ケイスケ:フルタニ トモユキ)
関連科目 前提科目(推奨): B3101
前提科目(関連): 90693
開講場所 SFC
授業形態 講義、実習・演習、グループワーク
履修者制限

履修人数を制限する

受入学生数(予定):約 100 人
選抜方法:課題提出による選抜

【課題内容】
これまでに履修した「データサイエンス(カリキュラム上のデータサイエンスと いう意味ではなく、広く一般的に使われている用語としてのデータサイエンス。 ビジネスやICTを含む。)」に関する科目を挙げ、それぞれの科目で自分が身につ けたと思うスキルを簡単にまとめなさい。 また、なぜ本授業を履修したいのか、本授業を通して何を学びたいのかを記載しなさい。1000字以内。

抽選で良い場合は「抽選希望」と記載しなさい。

◯エントリー〆切日時:2020年9月28日(月) 17:00
◯履修許可者発表日時:2020年9月30日(水) 17:00

◯テキスト入力

Only the selected students can take this course.

Number of students in the class (scheduled) : About 100
Pre-registration screening by submitted an assignment

【ASSIGNMENT】
これまでに履修した「データサイエンス(カリキュラム上のデータサイエンスと いう意味ではなく、広く一般的に使われている用語としてのデータサイエンス。 ビジネスやICTを含む。)」に関する科目を挙げ、それぞれの科目で自分が身につ けたと思うスキルを簡単にまとめなさい。 また、なぜ本授業を履修したいのか、本授業を通して何を学びたいのかを記載しなさい。1000字以内。

抽選で良い場合は「抽選希望」と記載しなさい。

* Schedule: TBD

履修条件

基本的な統計の知識があり、RやPythonが使えることを前提とします。

It is assumed that you have knowledge of basic statistics and can use R and Python.

授業内で配布するデータを授業目的以外で使用しないこと。

Do not use the data given in class for any purpose other than class purposes.

使用言語 日本語
連絡先 kei@sfc.keio.ac.jp
授業ホームページ
同一科目

学生が利用する予定機材/ソフト等

R, Python

R, Python

設置学部・研究科 総合政策・環境情報学部
大学院プロジェクト名

大学院プロジェクトサブメンバー

ゲストスピーカーの人数 0
履修選抜・課題タイプ=テキスト登録可 true
履修選抜・選抜課題タイプ=ファイル登録可 false
GIGAサティフィケート対象
最終更新日 2020/08/17 14:50:59

科目概要

非営利・営利組織の幹部が組織の中長期戦略を考えるにあたり、幹部の指示のもと、戦略を立案する部署が情報を収集し、分析を行っている。例えば、マーケティング(需要側のデータ)調査の場合、幹部がマーケティング部門に路上調査を命じ、ターゲット層の嗜好を調査するケースがあげられ、分析では、「原因と結果」の因果関係を明らかにすべく活動している。近年もこれらの調査手法が使われるケースも多々あるが、90年代後半に入り、ITの爆発的な普及により、個人はITを活用した情報の検索・収集が可能になり、付随して組織は、個人の購買履歴等の多種多様な膨大な顧客情報をデータとして容易に蓄積する事が可能になった。そして、2010年代に入りIT技術の更なる進歩により、大量のデータを大きな規模のままで分析を行い、新たな知の抽出や価値の創出ができるインフラが整いつつある。近年、これらの大量のデータをビッグデータと総称し、このデータを活用した最適な統計分析手法の一つである2つの要因の関係性を調査する相関分析を参考に意思決定を行うケースも出てきている。又、政府は、オープンデータに関して平成25年5月に第2次安倍内閣の新たなIT戦略として「世界最先端IT国家創造」宣言が発表され、行政が保有する公共データを2次利用可能な形で国民に提供する事を宣言し、企業が保有するデータと相互に結び付け、新たなビジネスや官民協働によってイノベーション創出の実現を目指している。これらのデータの更なる活用により、市場・組織・市民・政府の社会システムが変化しようとしている。本講座では、上記の社会システムに対応できる人材を育成すべく、ビッグデータを扱うアーキテクトの研究とシステムもわかる情報戦略を実働できるデータサイエンティストの育成に繋げるべくIT、アナリティクス、デザインの融合を目指した人材育成を行う。

As executives of non-profit and for-profit organizations think about the organization's medium- to long-term strategy, the department that develops the strategy, under the direction of the executives, collects and analyzes the information.  For example, in the case of marketing (demand-side data) research, executives may order the marketing department to conduct street research to determine the preferences of the target audience, and the analysis works to uncover the cause-and-effect relationship between "cause and effect".  In the late 1990s, the explosive spread of information technology made it possible for individuals to use IT to search and collect information, and organizations could easily accumulate a wide variety of information about their customers, such as their purchase history, as data.  And with further advances in information technology in the 2010s, we've been able to keep large amounts of data at a large scale. The infrastructure is being developed to analyze, extract new knowledge and create value. In recent years, these large amounts of data are collectively referred to as big data, and the optimal statistical analysis One of the methods, correlation analysis, which investigates the relationship between two factors, has been used in some cases to make decisions. It's coming.  In addition, in May 2013, the government announced the "Creation of the World's Most Advanced IT Nation" declaration as the new IT strategy of the second Abe cabinet regarding open data, which declares that public data held by the government will be provided to the people in a form that can be used for secondary purposes, and aims to realize the creation of new businesses and innovation through public-private cooperation by interconnecting it with data held by companies.  Further use of these data is changing the social systems of markets, organizations, citizens and governments.  In this course, in order to develop human resources that can respond to the above social systems, we aim to integrate IT, analytics, and design in order to nurture human resources that will lead to the development of data scientists who can conduct research on architects who handle big data and understand information strategies that include systems.

授業シラバス

主題と目標/授業の手法など

本授業では、ビジネスや社会課題の解決に必要となる、データサイエンティストの手法について学ぶ。 授業では、第7回データビジネス創造コンテストで参加者に提供した食べログのデータを使って、和食文化の価値創造について提案を行う。データ分析や解決手法の提案、そのフィージビリティの検証手法などを、実際のデータサイエンティストの指導を仰ぎながら、実践形式でおこなう。データサイエンスに係るプロセスを実践演習を通じて身に着けることがこの授業の最大の特徴である。

In this class, we will lean the methods of data scientists needed to solve business and social problems. The class will use the food log data which is provided to participants in the 7th Data Business Creation Contest to propose the creation of value in Japanese food culture. We will analyze the data, propose solutions, and validate the feasibility of the solutions by using actual data. Students are taught in a practical format under the guidance of a data scientist. The main purpose of this class is to acquire the of data science.

教材・参考文献

教科書は指定しない。
必要な教材については、授業の際にSFSを通じて配布する。

提出課題・試験・成績評価の方法など

日頃の授業への取り組み姿勢と個人レポート、グループ最終発表によって評価を行う。試験は行わない。

Grading will be based on the student's daily efforts in class, individual reports, and final group presentations. There will be no examination.

履修上の注意

本授業においては、実際に現場で活躍されているアクセンチュアのデータサイエンティストの方にもサポートいただきます。

In this class, you will be supported by Accenture data scientists who are actually working in the field.

授業計画

第1回 講座のガイダンス
[Guidance and Introduction]

カカクコム社から提供いただく食べログのデータについて説明をします。履修者は、このデータも使って和食を新たなステージに引き上げるための和食文化の価値創造提案に取り組み、依頼を受けたデータサイエンティストとして、授業最終日に施策を提案してもらいます。
また、実際のデータサイエンティストの方に来ていただいて、データサイエンティストの日常の業務に関する解説をしてもらいます。データサイエンティストの仕事は、データを分析することではなく、データ分析を通じてクライアントが抱える問題を解決することです。実務においてデータサイエンティストは、どのような問題に、どのようなデータを使ってアプローチをしているのかをこの機会に知ってください。
グループ分けをおこない、次週以降では基本的にこのグループで活動します。グループの中での役割などについても紹介します。

植原啓介、古谷知之


第2回 データの探索と可視化
[Exploratory Data Analysis and Visualization]

データ分析における姿勢を示します。John W. Tukey(テューキー)のExploratory Data Analysis(探索的データ解析)以来、データ分析には正解があるわけではなく、探索し、データから何かを探しだすことだとされています。本授業においては簡単なデータ分析を例に示しながら探索的データ分析について学びます。
授業後半はブループに別れ、グループ毎にデータ分析を行ってももらいます。

植原啓介、古谷知之


第3回 相関分析
[Correlation analysis]

データ分析において、変数の相関を理解することは大変重要です。相関分析とはなにか、また相関分析を行うにあたって注意すべき点や陥りやすいミスについて学びます。
授業後半はブループに別れ、グループ毎にデータ分析を行ってももらいます。

植原啓介、古谷知之


第4回 テキスト解析
[Text Analysis]

今回提供するデータの中には「口コミ」でーたがあります。「口コミ」は自然言語であり、分析には自然言語処理手法を必要とします。ここではテキストの数値化手法(TF-IDFやWord2Vec)や意味の解釈(RNN、トピックモデル)などについて紹介します。それぞれを詳しくやる時間はありませんので、導入のみです。
授業後半はブループに別れ、グループ毎にデータ分析を行ってももらいます。

植原啓介、古谷知之


第5回 決定木分析
[Decision Tree]

相関分析以外に決定木分析という手法があります。決定木はどの変数が事象にもっとも起用しているかを分析する手法です。ここではツールを使った決定木分析の方法や決定木の使い方について学びます。
授業後半はブループに別れ、グループ毎にデータ分析を行ってももらいます。

植原啓介、古谷知之


第6回 グループプレゼンテーション
[Group Presentation]

各グループに別れて、分析結果や提案についてプレゼンテーションを行ってもらいます。

植原啓介


第7回 分析
[Analysis]

グループに分かれてプレゼンテーションの準備をおこないます。

植原啓介、古谷知之


第8回 分析

グループに分かれてプレゼンテーションの準備をおこないます。


15回目に相当するその他の授業計画

レポート課題を課す。