2020年秋学期 - 統計基礎 / INTRODUCTION TO STATISTICS
| B3101 統計基礎 INTRODUCTION TO STATISTICS |
基盤科目-データサイエンス科目-データサイエンス1 Fundamental Subjects - Subjects of Data Science - Data Science 1 2 単位 |
| 実施形態 | 完全オンライン |
| 開催日程 | 秋学期 木曜日3時限 |
| 担当教員 | 小林 凌雅(コバヤシ リヨウガ) |
| 関連科目 | |
| 開講場所 | SFC |
| 授業形態 | 講義、実習・演習 |
| 履修者制限 |
履修人数を制限する Only the selected students can take this course. |
| 履修条件 |
「データサイエンス基礎」の単位を修得していること。またはデータサイエンス科目認定試験に合格していること。 In order to register the Subjects of Data Science, students need to earn credits for "Basics of Data Science" or pass the "Data Science Qualification Examination" |
| 使用言語 | 日本語 |
| 連絡先 | ryoga@sfc.keio.ac.jp |
| 授業ホームページ | |
| 同一科目 |
|
| 学生が利用する予定機材/ソフト等 |
|
| 設置学部・研究科 | 総合政策・環境情報学部 |
| 大学院プロジェクト名 |
|
| 大学院プロジェクトサブメンバー |
|
| ゲストスピーカーの人数 | 0 |
| 履修選抜・課題タイプ=テキスト登録可 | false |
| 履修選抜・選抜課題タイプ=ファイル登録可 | false |
| GIGAサティフィケート対象 | |
| 最終更新日 | 2020/08/17 18:24:40 |
科目概要
この授業では,データサイエンスの入門科目として,実際のデータの分析をしながら統計学の基礎とその応用を学んでいきます. データの収集や整理,統計分析,プレゼンテーションに至るまでの入門的技法を実践的・体験的に習得します.
具体的には,データの平均,分散,相関といった記述統計,母集団と標本,確率分布と標本分布などの確率統計の基礎,それらに基づく推定や検定などの統計的推測,そして分散分析や回帰分析のような統計モデルの手法までを扱います.
このクラスは統計手法の体験的理解を目指します。その代わり、分析を体験する宿題は重いことに注意してください。
この授業は同じ科目名でも担当者によって、進め方や内容が異なることがあります。内容をよく吟味して選択してください。
In this class, students are expected to study about basic statistics by analyzing data empirically. Basic techniques such as data collection, statistical analysis and presentation are introduced.
Lectures include (1) description of data such as average, variance and correlation, (2) basics of probability theories such as population and samples, stochastic distributions and sample distributions, and (3) statistical models such as regression analysis and analysis of variance.
Lecturers might change contents of syllabus.
授業シラバス
主題と目標/授業の手法など
この授業では,データサイエンスの入門科目として,実際のデータの分析をしながら統計学の基礎とその応用を学んでいきます. データの収集や整理,統計分析,プレゼンテーションに至るまでの入門的技法を実践的に習得します.
具体的には,データの平均,分散,相関といった記述統計,母集団と標本,確率分布と標本分布,大数の法則などの確率統計の基礎,それらに基づく推定や検定といった統計的推測,そして分散分析や回帰分析のような統計モデルの手法までを扱います.
授業は極めて実践的ですが、毎週出題される宿題は、操作トレーニングや統計分析の実践的なトレーニングであり、このコースを終了すれば、基礎的な統計分析の能力が身につくでしょう。それは世間が求めるデータ分析の実践能力でもあります。ただし統計技法を実践的に身につけるには、授業について行く「やる気」が必要です。いわゆる「楽勝科目」ではありません そこを注意してクラスを選択してください。
In this class, students are expected to study about basics of statistics by analyzing data empirically. Basic techniques such as data collection, statistical analysis and presentation are introduced.
Lectures include (1) description of data such as average, variance and correlation, (2) basics of probability theories such as population and samples, probabilistic distributions and sample distributions and (3) statistical models such as regression analysis and analysis of variance.
教材・参考文献
授業内で随時指定されます。
提出課題・試験・成績評価の方法など
期末レポートに重きを置いて、毎週授業中に出される実践的な宿題の提出との組み合わせによって成績評価します. 期末試験を課す授業もあります.
Term paper, which is most important, and weekly homeworks. While the course is very practical, weekly homeworks may be a bit heavy to you. Be careful to your time management!
履修上の注意
パソコンを使用しながら授業が行われますので,自分のパソコンを持参してください.パソコンはMacintoshかWindowsを使用して下さい.授業はMacintoshで行われますが、ソフトの操作は両方の機種で同一です。
授業で扱う内容は各授業で共通しますが、進め方やシラバスは授業ごとに異なります。授業の進度や受講生の理解度に応じて、講義と演習の順番を入れ替えることがあります。
Students are expected to have their own personal computer. Also, students are expected to have enough skills to operate their computers, including downloading the software and sample data files.
授業計画
第1回 イントロダクション
[Introduction]
この授業のイントロダクションとして,統計学の目的や意義,授業の進め方や成績評価の仕方について説明します.統計分析の基礎となる確率論を復習することもあります。
Purpose to learn statistics, outline of lecture and exercise.
Basics of probability theory.
第2回 確率変数と確率分布(1)
[Probability variables and distribution (1)]
離散型データ、連続型データとその確率変数について。
離散型確率変数:一様分布、二項分布、ポアソン分布
連続型確率変数:指数分布、ベータ分布、ガンマ分布、正規分布、χ2分布
Discrete data, continuous data and their random variables.
Discrete random variables: uniform distribution, binomial distribution, Poisson distribution
Continuous random variables: exponential distribution, beta distribution, gamma distribution, normal distribution, χ2 distribution
第3回 確率変数と確率分布(2)
[Probability variables and distribution (1)]
連続型確率分布の平均と分散、二変量の確率分布、同時確率・周辺確率・条件付き確率
Mean and variance of continuous probability distribution, bivariate probability distribution, joint probability, marginal probability, conditional probability
第4回 母集団と標本
[Population and sample]
標本平均と標本分散、不偏分散、自由度、大数の法則、中心極限定理、正規分布、信頼区間、標本の信頼度
Sample mean and sample variance, unbiased variance, degrees of freedom, law of large numbers, central limit theorem, normal distribution, confidence interval, sample reliability
第5回 単回帰分析(1)
[Simple regression (1)]
ピアソンの相関係数、散布図、共分散、単回帰分析、回帰係数、最小二乗法、決定係数、重回帰係数
Pearson's correlation coefficient, scatter plot, covariance, simple regression analysis, regression coefficient, least squares method, coefficient of determination, multiple regression coefficient
第6回 単回帰分析(2)
[Simple regression (2)]
前回の続き
第7回 仮説検定(1)
[ Hypothesis testing (1)]
単回帰分析、回帰係数の統計量、残差の性質、回帰係数に関する検定、信頼区間、t分布、仮説検定、帰無仮説と対立仮説、有意水準、統計的過誤、両側検定と片側検定
Simple regression analysis, statistics of regression coefficients, nature of residuals, tests on regression coefficients, confidence intervals, t-distribution, hypothesis tests, null and alternative hypotheses, significance levels, statistical errors, two-sided tests and one-sided tests
第8回 仮説検定(2)
[ Hypothesis testing (2)]
前回の続き
第9回 重回帰分析
[Multiple regression]
単回帰分析の実装、残差の性質、残差解析と外れ値の検出
重回帰分析の実装、データの標準化と標準化偏回帰係数、多重共線性
Implement simple regression analysis, nature of residuals, residual analysis and outlier detection
Implement multiple regression analysis, data standardization and standardized partial regression coefficients, multicollinearity
第10回 演習(1)
[Exercise (1)]
統計ソフトを使った演習
基本的な使い方、データの入出力、グラフの作図
確率分布など
Exercises using statistical software
Basic usage, data input / output, graph drawing
Probability distribution, etc.
第11回 演習(2)
[Exercise (2)]
統計ソフトを使った演習
平均、分散、相関図
単回帰分析
Exercises using statistical software
Mean, variance, correlation chart
Simple regression analysis
第12回 演習(3)
[Exercise (3)]
統計ソフトを使った演習
単回帰分析
重回帰分析
最終課題に向けてのデータ分析など
Exercises using statistical software
Simple regression analysis
Multiple regression analysis
Data analysis for final report, etc.
第13回 演習(4)
[Exercise (4)]
データ分析のレポーティング,プレゼンテーション,質疑応答など
Depending on the class, data analysis reporting, presentation, Q & A, etc.
第14回 演習(5)
[Exercise (5) ]
データ分析のレポーティング,プレゼンテーション,質疑応答など
Depending on the class, data analysis reporting, presentation, Q & A, etc.
第15回 演習(6)
[Exercise (6)]
データ分析のレポーティング,プレゼンテーション,質疑応答など
Exercises using statistical software
Depending on the class, data analysis reporting, presentation, Q & A, etc.
15回目に相当するその他の授業計画
データ分析のレポーティング,プレゼンテーション,質疑応答など
Reports of data analysis, presentation, Q&A, etc.