山梨大学電子シラバス>検索結果一覧>授業データ



授業科目名 データサイエンス入門
時間割番号 CDS009
担当教員名 チェン リー チュイ
開講学期・曜日・時限 後期・金・I-1-II-1 単位数 2
<対象学生>
応用化学科
<授業の目的>
この授業は、コンピュータの実習を通じて、数値データの処理・統計分析・可視化、文書・レポート・学術発表資料の作成、情報収集・交換などができるようになること。
すなわち「情報リテラシ−」と「データリテラシー」を身につけることを目標としている。
<到達目標>  到達目標とは
1) コンピュータの基本操作、ファイルの管理などを行うことができる。
2) 文書作成ソフトを利用して文書・レポートの作成を行うことができる。
3) 表計算ソフト等を利用して実験データ等のデータ整理、作図、レポートの作成を行うことができる。
4) ネットワーク環境の基本構成を理解し,ネットワークにアクセスして情報の検索を行うことができる。
5) コンピュータを用いてデータの統計処理を行うことができる。
6) 数値データの可視化によって特徴を見つけることができる。
7) データサイエンスや計算科学等に必要なプログラミングの基礎を、Julia 言語を通して修得する。
<授業の方法>
学習管理システムE-Learning (Moodle)上に授業・課題資料を掲示する。
授業資料を参考して実習を行い、期限までに課題を提出する。
実習では,情報メディア館実習室の端末(コンピュータ、一人一台)を使用する。
自分の個人パソコンを使ってもOKです。
この授業はフリーの科学技術計算用言語 Julia を活用する。

対面とZOOMによる授業を予定しています。
<成績評価の方法>
No評価項目割合評価の観点
1小テスト/レポート 70  %講義の途中でレポートで講義内容をどの程度理解できたか 
2受講態度 30  %講義に出席して実習を十分に行っているか 
<受講に際して・学生へのメッセージ>
(未登録)
<テキスト>
(未登録)
<参考書>
(未登録)
<授業計画の概要>
1) ガイダンス
データサイエンス概論、コンピュータ、CPU、記憶装置、ファイルシステム、拡張子、ファイルフォーマット一覧、Internet、Email、url
Julia : の紹介、演算、print(“Hello World”)

2) データの型
2進数、16進数、Byte、文字コード(ASCII、Unicode)、Hexdump、データ圧縮、Zip file
Julia:演算、配列、文字列、slice 、max、min、sum、rand、open、write、close、read

3) 応用線形代数I
Juliaを用いて、Vector ベクトル、dot product(内積)、cross product外積、Matrix 行列の演算、transpose転置、determinant 行列式、inverse 逆行列、Linear Transformation線形写像、plot

4) Tabular data 表形式データ
表計算、CSVファイル形式、気象庁データ、NISTデータベース
Excel: 基本操作、相対参照、絶対参照、if 関数、グラフの作成
Julia: DelimitedFiles.readdlm、DataFrames、Gadfly、Plots

5) プログラミングによるデータ処理の自動化
Julia: for ループ、range、primitive data type 基本型、BigInt、if else文

6)自作関数・モジュールによるデータ解析
数値微積分、テキスト解析
Julia: hcat、vcat 、find、findall、sort、function、

7)応用統計学I
平均値、中央値、最頻値、分散、不偏分散、標準偏差、Zscore、偏差値
Julia : randn、Statistics パッケージmean, std, var
Plot: Histogram ヒストグラム、正規分布

8)応用線形代数II
最小二乗法、固有値eigenvalue、固有ベクトルeigenvector、主成分分析
Julia: eigvals、eigvecs

9)応用統計学II
Covariance 共分散、Pearson correlation coefficient 相関係数、多変量解析、PCA
Julia: Gadfly subplot でデータの可視化

10) Datasets の入手
Google Dataset Search、OpenStreetMap、RDatasets、e-Stat

11) 大容量・高速情報通信の時代
共通鍵暗号、公開鍵暗号、人工知能、仮想通貨、電子Money、量子コンピュータ、ビッグデータ、スーパーコンピュータ、5G
MS PowerPoint:図形、テキストの挿入、図形の接合、型抜き、アニメーション

12) ベイズ統計学Bayesian statistics、機械学習 Machine Learning

13) Artificial Neural Network, Deep learning

14) 最終課題の説明、討論
MS Word:レイアウト、図表の挿入、見出し、目次 長文の編集

15) まとめ、最終課題の提出