C2131
データ×AI・アート・デザイン時代のテキスト処理
TEXT PROCESSING IN THE AGE OF DATA X AI, ART AND DESIGN
先端科目-環境情報系
Advanced Subjects - Series of Environment And Information Studies
2 単位
実施形態 完全オンライン
開催日程 秋学期 月曜日2時限
担当教員 東中 竜一郎(ヒガシナカ リユウイチロウ)
関連科目 前提科目(推奨): B4001
開講場所 SFC
授業形態 講義、実習・演習
履修者制限

履修人数を制限する

受入学生数(予定):約 100 人
選抜方法:課題提出による選抜

【課題内容】
本講義から何を得たいと思っているか,および,本講義で学ぶ内容をどのような分野で活用したいと考えているかについて述べてください.なるべく具体的に記述すること.



Please describe what you expect to gain from this course and in what fields you want to use the content of this course. Be as specific as possible.

◯エントリー〆切日時:2020年9月28日(月) 17:00
◯履修許可者発表日時:2020年9月30日(水) 17:00

◯テキスト入力

Only the selected students can take this course.

Number of students in the class (scheduled) : About 100
Pre-registration screening by submitted an assignment

【ASSIGNMENT】
本講義から何を得たいと思っているか,および,本講義で学ぶ内容をどのような分野で活用したいと考えているかについて述べてください.なるべく具体的に記述すること.



Please describe what you expect to gain from this course and in what fields you want to use the content of this course. Be as specific as possible.

* Schedule: TBD

履修条件

使用言語 日本語
連絡先 ryuichiro.higashinaka@gmail.com
授業ホームページ
同一科目

学生が利用する予定機材/ソフト等

ラップトップ(Win/Mac/Linux)

Laptop (Win/Mac/Linux)

設置学部・研究科 総合政策・環境情報学部
大学院プロジェクト名

大学院プロジェクトサブメンバー

ゲストスピーカーの人数 0
履修選抜・課題タイプ=テキスト登録可 true
履修選抜・選抜課題タイプ=ファイル登録可 false
GIGAサティフィケート対象
最終更新日 2020/07/30 00:42:45

科目概要

人工知能が様々なデータを処理する時代において,言葉も他のデータと同様に扱えることが望ましい.テキスト処理技術を駆使することは大きな価値創造につながるだろう.本講義では,テキスト処理の基本的な技法についての講義と実際に自分自身の手でテキスト処理アプリケーションを作る演習により,受講者がテキスト処理を任意の分野で駆使できるようになることを目指す.本講義は,複雑な自然言語処理の理論よりも,テキスト処理の基本的な技法や応用の仕方,テキスト処理の可能性やそれを作る楽しさ・面白さを知ることに重点を置く.本講義の最後では,講義で得た技術や知識を駆使して,受講者が自分の手でテキスト処理のアプリケーションを作成する.

In the age of artificial intelligence, it is desirable that text data
are treated like any other data. The use of text processing technology
will lead to significant value creation. Students are expected to
learn basic techniques of text processing and to develop their own
text processing applications. In this course, the emphasis is not on
understanding complex natural language processing theories, but rather
on the basic techniques and applications of text processing, the
possibilities of text processing, and the fun and excitement of using
it. At the end of the course, students will create their own text
processing applications using the skills and knowledge they learned in
the course.

授業シラバス

主題と目標/授業の手法など

テキスト処理を使いこなすことを主題とし,テキスト処理の基本的な技法についての講義と実際に自分自身の手でテキスト処理アプリケーションを作る演習により,受講者がテキスト処理を任意の分野で駆使できるようになることを目指す.

Students are expected to learn how to use text processing in their own fields through lectures on basic techniques of text processing and exercises to build text processing applications by themselves.

教材・参考文献

東中竜一郎,"おうちで学べる人工知能のきほん", ISBN: 978-4-798-151533, 2017.

東中竜一郎, 稲葉通将, 水上雅博, "Pythonでつくる対話システム", ISBN: 978-4274224799, 2020.

黒橋禎夫,"自然言語処理",ISBN: 978-4-595-31573-2,放送大学教育振興会,2015.

James Allen, Natural Language Understanding (2nd Edition), ISBN: 978-0-805-30334-6, Pearson, 1994.

提出課題・試験・成績評価の方法など

出席,授業で課す演習課題,最終課題に基づき総合的に評価する.

Students will be evaluated on the basis of attendance, exercises and the final assignment.

履修上の注意

授業計画

第1回 テキスト処理の概要
[Overview of text processing]

テキスト処理・自然言語処理の全体像を説明する.

The overview of text processing and natural language processing is provided.


第2回 形態素解析
[Morphological analysis]

自然言語をコンピュータが解析するための基本技術である形態素解析について説明する.特に,統計的な形態素解析の考え方について学ぶ.

Morphological analysis, which is one of the most basic techniques for computers to analyze natural language, is described.


第3回 構文解析
[Syntactic analysis]

自然言語をコンピュータが解析するための基本技術である構文解析について説明する.文脈自由文法の考え方やトップダウンパーザについて学ぶ.

Syntactic analysis, which derives the syntactic structure of a sentence, is described. Students will learn contextual free grammar and top-down parsers.


第4回 文字列検索
[String search]

自然言語を扱う際に重要となる文字列検索技術について説明する.ボイヤ・ムーア法,トライ木などについて学ぶ.

Methods for searching strings, such as the Boyer-Moore string-search algorithm and trie, are described.


第5回 文書検索と文書分類
[Document retrieval and document classification]

基本的なテキスト処理アプリケーションである文書検索・文書分類について説明する.TF-IDFの考え方,単純ベイズ分類器について学ぶ.

Document retrieval and document classification, which are basic text processing applications, are described. Students will learn the concept of TF-IDF and naive Bayes classifier.


第6回 深層学習を用いたテキスト処理
[Text processing using deep learning]

深層学習を用いたテキスト処理の技法について説明する.Word2vec,RNNやTransformerを用いた技法を紹介する.

Text processing techniques based on deep learning, such as Word2vec, RNN and Transformer, are described.


第7回 テキスト処理の応用事例
[Application of text processing technology]

テキスト処理の応用事例について演習を交え紹介する.

Students will learn how to use text processing technology through an exercise.


第8回 テキスト処理の他分野適用(1)
[Application of text processing technology to other domains (1)]

テキスト処理をその他の分野に応用する事例について紹介する.
MedTechを予定.

Students will learn how to apply text processing technology to other domains, e.g., MedTech.


第9回 テキスト処理の他分野適用(2)
[Application of text processing technology to other domains (2)]

テキスト処理をその他の分野に応用する事例について紹介する.
FinTech/LegalTechを予定.

Students will learn how to apply text processing technology to other domains, e.g., FinTech/LegalTech.


第10回 テキスト処理アプリケーションの作成(1)
[Creating own text processing applications (1)]

自身の興味のある分野のデータを用い,テキスト処理を行うアプリケーションを作成する.

Students will create a text processing application using data from your own field of interest.


第11回 テキスト処理アプリケーションの作成(2)
[Creating own text processing applications (2)]

同上

Same as above.


第12回 アプリケーション開発 (1)
[Application development (1)]

教員・スタッフの協力のもと,自身のテキスト処理アプリケーションを開発します.

Students develop their own application with the help of teaching staff.


第13回 アプリケーション開発 (2)
[Application development (2)]

同上

Same as above.


第14回 アプリケーション開発 (3)
[Application development (3)]

同上

Same as above.


第15回 プレゼンテーション
[Presentation]

作成したアプリケーションについて報告会を実施する.

In the final presentation, students will present their text processing applications.


15回目に相当するその他の授業計画