2020年秋学期 - データ・ドリブン社会の創発と戦略 / EMERGENCE OF DATA DRIVEN SOCIETY AND STRATEGY
| X1038 データ・ドリブン社会の創発と戦略 EMERGENCE OF DATA DRIVEN SOCIETY AND STRATEGY |
特設科目 Special Seminars 2 単位 |
| 実施形態 | 完全オンライン |
| 開催日程 | 秋学期 木曜日2時限 |
| 担当教員 | 安宅 和人(アタカ カズト) |
| 関連科目 | |
| 開講場所 | SFC |
| 授業形態 | 講義、実習・演習、グループワーク |
| 履修者制限 |
履修人数を制限する Only the selected students can take this course. |
| 履修条件 |
高校1-2年程度の数学の知識、スキル、Excelで基本的なことができる程度の素養はある students with at least 10th & 11th grade mathematics skill and basic familiarity of Excel 原則1~3年生のみの履修とする。 Open mainly for freshmen, sophomores, and juniors. |
| 使用言語 | 日本語 |
| 連絡先 | datadriven-staff@sfc.keio.ac.jp, ataka@sfc.keio.ac.jp (9/25更新) |
| 授業ホームページ | |
| 同一科目 |
|
| 学生が利用する予定機材/ソフト等 |
Excel, Word, PowerPoint(あると望ましい) Excel, Word, PowerPoint |
| 設置学部・研究科 | 総合政策・環境情報学部 |
| 大学院プロジェクト名 |
|
| 大学院プロジェクトサブメンバー |
|
| ゲストスピーカーの人数 | 本講義4, 補講2 |
| 履修選抜・課題タイプ=テキスト登録可 | false |
| 履修選抜・選抜課題タイプ=ファイル登録可 | true |
| GIGAサティフィケート対象 | |
| 最終更新日 | 2020/10/07 14:01 by ataka |
科目概要
■ 本講座の位置づけ
何らかの事業を起こすにしろ、会社に入るにしろここから先の時代においてデータドリブンな分析力、問題解決力、データ利活用に対する皮膚感覚的な理解は不可欠である。
本講座は、高校1-2年程度の数学の知識、スキル、Excelで基本的なことができる程度の素養はあるが、データ分析、データの利活用についてさして経験のあるわけではない人に対して、データの大切さと力、分析の楽しさを実感してもらうことを通じ、現代社会を生き抜くため最低限、基礎となるデータリテラシー、データで考える力を身につけてもらうことを目指す。
■ 身につけてもらうことを目指す技能
- データ社会に対するパースペクティブ
- 各種関連バズワードの適切な理解
- データの意味合いを理解するための基礎となる力
- データに騙されないようになるための基礎となる力
- 数字のハンドリング力、数量的分析力
- 基本的な問題解決能力
- 情報処理、基礎プログラミング力
■ 期待成果
- データって面白い、分析はスゴイ、と知る
- サイエンスおよび分析的思考、データリテラシーの実戦的な基本を身につける
- 世の中のデータ関連のニュースを聞いても、何らかの意味合いがわかるようになる
■(参考)これまでの履修者の声(抜粋)
「もっとはやくこのような素晴らしい授業と出会いたかったです」
「データ分析は奥が深く、ついていくのに必至でした。とはいえSFCのどの講座よりも熱く面白い授業であったことは間違いなかったです」
「散々苦しみましたが、苦しめば苦しむほど見えるものがあって楽しかったです」
「大学に入って一番成長できたと感じることのできる講義でした」
「データへの考え方が、根本的に変わりました」
「今学期1番楽しみにしていた授業でしたが、その期待をはるかに上回る内容でとても満足しています」
「今期一番面白かった授業のひとつです。講義の部分も演習の部分も面白く、これから役に立つものばかりで楽しかったです」
「本当に疲れた講義だったけど、それ以上に一番成長できた半年だったと胸を張って言える」
「これは間違いなく1年生の春にデータサイエンス科目として全員が必修でとるべき内容の講義で、もっと早くこの講義が実現していれば…と思いました」
「全14回+補講をありがとうございました。課題は難しかったけど、毎回面⽩いことが聞けてとてもよかったです。データに対する姿勢が確実に変わりました」
「以前は、ツールの使い⽅方をマスターすることが重要だと思っていたが、授業を通して、それより、問題の捉え⽅など、より本質的なものを⾒極める思考が重要であることに気づきました。非常に、有意義な時間で、講義を楽しめました
「3年間の大学生活で最も刺激的な科目で、分析を仕事にするということを具体的に考えながら受講できました。ありがとうございました」
「これで授業が終わりだなんて悲しいです。アドバンスも取りたいです。今後もSFCでの授業よろしくお願いします!」
「時々サボってしまうこともありましたが、半年を通して⾃分がすごく我慢強く、課題に対して前向きになったような気がします。こんなに難しい課題を課されたことは今までにありませんでしたが、今までだったら諦めているような課題でも、安宅さんや他の⽅々の熱⼼な授業のおかげで最後まで諦めずに、苦戦しつつも秋学期を終えることができました。本当にありがとうございました」
「この授業は、他の大学では中々経験できない本当に貴重な体験をさせていただき、感謝してもしきれません。この授業と同じレベルの内容の深さをもつ授業はSFCにはほぼ皆無に等しく、今まで履修した中で群を抜いて得られるものが⼤きかった授業であると断言できます。一学期間、本当にありがとうございました」
「データ分析についてはある程度経験があったが、毎回の講義で気づかされることは⾮常に多かった」
「とても濃密な講義をありがとうございました!!データドリブンとは何か?その必要性は?などを⼤局的に解いた講義から、チャートや予測モデルの作成などの実習まで、インプットとアウトプットを両⽴して⾏うことができて、実践的でとても楽しく分析や問題解決といったことを学べました。今後もこれらの考え⽅を忘れず、20代で突き抜けられるよう頑張ります」
「毎回楽しい授業をありがとうございました。単にデータ分析をガリガリにおこなうと思っていたら、これまで知らなかったそもそも論についての話を伺える、実りの多いものになりました。ツールの使い⽅といったその場かぎりの知識では終わらない、より深い層の学びを得られたので、今後に活かしていきたいと思います」
■ 利用ツール
- Excel(必須)
- Powerpoint(任意だが使えることが望ましい)
- MySQL (任意)
- R (任意)
- Python (任意)
■ Outline of this course
Whether you are going to do some kind of business or go into the company, data-driven analytical problem-solving skills and hands-on understanding of data utilization are essential in the days ahead.
This course aims to develop minimum data literacy to survive in this data-driven age for the students with at least 10th-11th grade mathematics skill and basic familiarity of Excel, on the assumption that they do not have much experience in data analysis and utilization.
Classes will be conducted interactively as much as possible. We will invest a considerable amount of time for each homework review and answers to the questions received in a weekly questionnaire.
■ Skill that aims to be acquired
- Perspectives on data-driven society
- Appropriate understanding of various related buzzwords
- Basic skills to extract implications of data
- Basic skills to avoid being deceived by data
- Basic skills of data handling and quantitative analysis
(Note) It is not a course to nurture experts in information science and big data processing
- Natural language processing
- Image processing
- Machine learning
- Data infrastructure construction
- Real time processing, etc.
■Expected outcome
Learns the power and fun of data
Acquire the practical basis of science and data-driven thinking
Becoming able to get the some implications when encounters with a data related news
■Tools to be used
Excel (required)
Powerpoint (optional but preferred to use)
MySQL (optional)
R (optional)
Python (optional)
授業シラバス
主題と目標/授業の手法など
■ 本講義の特徴
1. 長年、多様なデータを用いたさまざまな分析に関わってきた立場から、実際の仕事や研究に役立つ分析力とは何かを実戦的に伝承する
2. 情報科学技術以前の本質的なサイエンス、分析、問題解決の考
え方に極力フォーカスする
3. 知っているだけではなく分かる、分かるだけでなく出来るに注
力する、、、アタマだけで知っていることを認めない
4. 一方通行ではなく、できる限りインタラクティブに実施する
5. ログデータと市場リサーチデータの両方を扱う
6. 普通には外に出ることがないヤフーのデータを利活用する
(注)ツール系のスキルを教える講座ではありません。
必要ツールがある程度使えることを前提に講義を進めます。
どのようなツールを使うかは各自学生に任せます最低限のツールスキル(Excel、SQL)は補講で対応します。必要なひとは自発的な参加。
参加しない場合はできると見なします(資料・ビデオは履修者限定で展開しますのでコンフリクトがある場合、そちらを参照)ただ純粋にツールスキルを身に着けたい方は本講座ではなく別の講座を履修して下さい
■ 補講について
解析ツールなどのスキルは補講授業で対応する(必要な人は自発的に参加すること。参加しない場合はできると見なします)。
講義は、情報科学技術以前の本質的な分析、問題解決の考え方に極力フォーカスする。
■ 想定受講者
- 情報科学オタクというより、本当に世の中で分析、データ利活用で変化を起こしたい方(本講座でハイエンドの機械学習、自然言語処理問題などは扱いません)
- この世界でデータや分析はどのように世の中に役に立っているのかを理解し、その基本的なスキルを身につけたいと思っている方
- 課題解決、意思決定と分析の関係について肌で感じ、学びたいと思っている方
- これまで色々分析に取り組んでみたが、価値を生み出すポイントが良くわからない方
■Features of this course
1) Focus on the practical analytical skill for actual business
2) Focus on scientific thinking rather than informatics
3) Focus on execution rather than lectures
4) Perform interactive as much as possible, not one way
5) Treat both log data and market research data
6) Use the data of Yahoo! JAPAN which does not go out normally
(Note) It is not a course to teach tool skills. If you only want purely tool skills, please take another course instead
I will proceed the lectures on the premise that students are familiar with the necessary tools to some extent. I will leave the students to decide what tools to use
Minimum tool skills (Excel, SQL) are supported by supplements. If you do not participate those supplements, you are considered to be able to use those tools.
If you only want to acquire purely tool skills, please take another course instead.
■ Expected students
Those who really want to make a change by analyzing the data and utilizing the data rather than information science nerds (we do not deal with high end machine learning, natural language processing problems etc. in this course)
People who want to understand how data and analysis are delivering the values in this world and who want to acquire basic skills on them.
People who want to get the feel of how the data can be used for general decision making.
People who have tried various analyzes so far, but who do not get the point of value creation using data.
★ This course covers general perspective of scientific and analytical thinking which is not generally taught as a whole. Highly recommended for a freshman or a sophomore.
教材・参考文献
■ 参考文献
「統計でウソをつく法―数式を使わない統計学入門」 (ブルーバックス)
「データサイエンス講義」(オライリー・ジャパン)
“Data Science for Business” (O’Reilly)
「イシューからはじめよ」安宅和人著(英治出版)
「シン・ニホン」安宅和人著(NewsPicks publishing)
「会社を変える分析の力」河本薫著(講談社現代新書)
「シグナル&ノイズ - 天才データアナリストの「予測学」」ネイト・シルバー著(日経BP)
「トップデータサイエンティストが教えるデータ活用実践教室」(日経BP)
「10年戦えるデータ分析入門」青木峰郎著(SB Creative)
「Statistics Hacks - 統計の基本と世界を測るテクニック」Bruce Frey著 (O’Reily ジャパン)
「統計学入門」(東京大学出版会)
「人文・社会科学の統計学」(東京大学出版会)
「自然科学の統計学」(東京大学出版会)
※ 必ずしも適切な教材が見当たらないため、授業の進捗にそって適宜紹介する。
提出課題・試験・成績評価の方法など
・ワーク(宿題+毎回のアンケート)
- 提出、、、加点(未提出、、、減点)
- できが良い、面白い、、、更に加点
・講義、チームへの貢献を評価します(以下を加点)
- 建設的な質問
- 積極的、建設的な発言
- リーダーシップ、フォロワーシップ
Attendance, submission of home-works (almost every week), and contributions to the class
- constructive questions
- positive, constructive remarks
- Leadership, Followership
履修上の注意
zoom設定しました。https://keio-univ.zoom.us/j/84843201943?pwd=cmpVVklRM2dIWG5mVnF1czBPeHFEQT09
授業計画
第1回 時代背景と本講座の位置づけ
[Basic perspectives and positioning of this course]
- データドリブンな課題解決領域の広がり
- ドメイン知識の重要性
- 3つのデータ
- データとデータ解析
- 歴史的な局面
- 求められる人物
- Professional とは何か?
- Width of data driven problem solving
- Importance of Domain Knowledge
- 3 major types of data
- Data and data analysis
- Historic aspects
- Key skills in this data-driven age
- What is Professional?
第2回 分析の本質とデータ利活用の広がり
[The essence of analysis and width of data utilization]
- 分析の基本
- 分析の3つの目的
- 意味合い出しのポイント
- ダメな分析のパタン
- データ表現の基本
- 統計数理の5つの役割
- データの広がりとデータごとによる特徴
Basics of analysis
Three objectives of analysis
Implication of analysis
Bad patterns of analysis
Basics of data representation
Five roles of statistical mathematics
Types and features of data
第3回 データから価値を生み出すとは何か?
[How to generate values from data?]
- 調査データとビッグデータのサイクル
- 聞いたことがある、わかっている、できるの違い
- データ利活用の 3 要素、、、収集、処理、活用
- データを使う目的
- 事業でのデータ利用の3用途
- マーケティングとは何か
- マーケティング的な事業の見方と課題
Cycle between survey data and big data
Difference of knowing and can-doing
Three elements of data utilization
Objectives of using data
3 major applications for data usage in business
What is marketing?
Marketing-based perspectives of business
第4回 調査データ1:データを読む
[Survey data 1: Reading the data]
- いけてない分析の見極め方
- データを読むポイント
- 相関と因果
- 相関があっても因果関係のない典型的パターン
- 可視化のプロセス
- 答えを出す手順
★(補講1)Excel1:Excel の基本
本講義日の3限に実施(後日視聴可)
How to judge bad analyses
Basics of reading the data
Causation and correlation
Basic process of data visualization
Procedure to generate answers from data
(supplement1) Excel basics1
第5回 調査データ 2:データの性質を知る
[Survey data 2: Knowing the nature of data]
- データを眺める(性質を理解する)
- 比較して意味合いを出す
- どのぐらい外れると意味のある異常値なのか?
- 軸選び
- クラスタリングとセグメンテーション
- 分析結果から試算する、、、推計のロジック
★ (補講2)Excel2:分析の基本
本講義日の3限に実施(後日視聴可)
- 分析ツール
- 基礎的な統計解析: 和、平均、分散、相関
- 相関係数 R と決定係数 R2
- クロス分析(ピボットテーブル)
- 散布図からカーブフィットする
How to watch the data
Extract implications by comparison
How far is it a meaningful abnormal value?
Picking axes of analysis
Clustering and segmentation
Estimate from analytical results
(supplement2) Excel basics2
第6回 データをチャート化する
[From data to chart 1]
- チャート化の 2 つの目的
- チャートの基本構造
- 15 秒ルール
- 縦と横の広がり
- 標準化と重み付け
(補講3)SQLの基礎1
本講義日の3限に実施(後日視聴可)
Two objectives of chart-writing
Basic structure of a data-driven chart
15 second rule
Vertical and horizontal axes
Normalization and weighting of data
第7回 行動ログデータ 1
[Behavior log data 1]
- リアル空間のデータ化
- コンテキスト・アウェア・ コンピューティング(Context
- Aware Computing)
- スマホに内蔵されているセンサ
- 行動ログに隠された情報
- 活動量計データと同行検知
(補講4)SQLの基礎2
本講義日の3限に実施(後日視聴可)
Data from real space
Context Aware Computing
Sensors in the smartphone
Information hidden in the action log
Activity meter data and accompanying detection
(supplement4) SQL basics2
第8回 行動ログデータ2
[Behavior log data 2]
- データを眺め、仮説をたてる
- グラフ的な関係を見る
- 大量の単純処理を回す工夫
- プログラムの役割
- センサデータ解析のための前処理
- データ成型、データ変換、ノイズ除去
How to observe data for making hypotheses
See graphical relationship
Tips for handling too many tedious process
Preprocessing for sensor data analysis
Data molding, data conversion, noise removal
第9回 調査データ3:ニーズを掴む
[Survey data 3: Grasping needs ]
- 基本となるマインドセット
- ニーズとベネフィット
- ニーズの 4 レイヤ
- ブランドダイアモンド
- 本音と建前
- ブレイクポイント
- 消費者マーケティングにおけるリサーチ手法の広がり
- 軸出しに関する考察
- MECE に考える技
Needs and Benefits
4 layers of needs
Brand Diamond
Stated importance vs. derived importance
Break point
Survey methods in consumer marketing
Insights of axis generation in analysis
Techniques to think in a MECE way
第10回 クエリログデータ1:罹患を予測する
[Query log data 1: Predicting morbidity]
クエリデータとはなにか
データ分析と可視化の関係
データ利用基盤の三層構造
情報利活用に必要なプロフェッショナルの広がり
イシュー見極めのポイント
モデル化と予測
シグナルとノイズ
実数と指数
What is query data?
Relationship between data analysis and visualization
Three-layer structure of data utilization
Width of data professionals
How to figure out key issues?
Modeling and forecasting
Signal and noise
Real number and index
第11回 クエリログデータ2:選挙予測
[Query log data 2: Predicting national poles]
縦軸と横軸:変数とアウトプット
データ類似性の判別
ドメイン知識の重要性
モデル化と予測2
Vertical and horizontal axis: variables and outputs
Determination of data similarity
Importance of domain knowledge
Modeling and forecasting 2
第12回 データとAIがもたらす未来
[The future that data and AI will bring]
平均は事実を必ずしも表さない
AIに関する誤解と正しい理解
ビッグデータとAIの関係
機械学習によるAIがもたらす変化
シゴトの未来
人工知能の不都合な真実
AI×データはビジネスをどう変えるか
Average does not necessarily represent facts
Relationship between big data and AI
Changes brought by machine learning-based AI
Myths and truths on AI
The future of “Work”
How will AI × data change business?
第13回 Excel補講1および2
[Excel basics 1 and 2]
第4回及び第5回の講義日の3限に実施(後日視聴可)
第14回 SQL補講1および2
[SQL basics1 and 2]
第6回及び第7回の講義日の3限に実施(後日視聴可)
第15回 各回の課題ワークに伴う予備検討
[Preparatory works along with assignments]
15回目に相当するその他の授業計画
エクセル、MySQLなどの統計処理、解析ツールの導入と使い方入門
Introduction and usage of statistical processing such as Excel and MySQL, analysis tools