十の並列した脳

何でも勉強する,毎週月木曜に投稿予定

「初探機器學習使用Python」まとめ#1 今後の進行について,本書使用的數學符號

「初探機器學習使用Python」(↓の中国語(繁体字)版 )

Thoughtful Machine Learning with Python: A Test-Driven Approach

Thoughtful Machine Learning with Python: A Test-Driven Approach

 

 

台湾に行った時の土産として購入。

 

さて,今まで基礎統計,数理統計,ベイズ統計などのネタでブログを書いてきて,

 

「そろそろ機械学習の概論について書こう

「でもそのネタ,ネット上に腐るほどあるし

自己流で説明するとはいえ,ユニークさのないネタに対して消極的であった。

 

で台湾の書店で見つけたのがこれ。なんかの気の迷いで買った。

f:id:ryosuke_okubo:20190421113403j:plain

「せっかくだから中国語勉強したいな

「......そうだ,中国語読解と絡めたら面白いのでは」

 

そんなわけで本記事は作成されることとなる。

 

 

全体の概要 

目次

第一章 大致接近正確的軟體 

第二章 機器學習速覽 

第三章 K-最近鄰法 

第四章 單純貝氏分類 

第五章 決策樹與隨機森林 

第六章 隱馬可夫模型 

第七章 支持向量機 

第八章 類神經網路 

第九章 分群 

第十章 資料萃取與模型改善 

第十一章 全書總結

 

本記事の進め方

進行順

#1 今後の進行について,本書使用的數學符號(第二章より)

#2 第二章 機器學習速覽

#3 第一章 大致接近正確的軟體(ソフトウェア開発の概要)

#4〜 第三章(機械学習の各手法について)から1章ずつ順番に扱う

 

中国語の訳について

第一章の本書的預期の前半部を例に方針を説明する。

本書主要涵蓋機器學習 的基礎內容,期望讀者閱讀本書之後,對於如何撰寫機器學習相關的程式來說,能夠獲得更佳的理解,以及針對如何將程式部署到正式上線環境逹到一定的運作規模而言,能夠携得有效的認識。(p13)

 

まず,個人的に重要と感じた単語について,原文で太字にした上で意味を列挙する。

単語

  • 機器學習:Machine Learning,機械学習
  • :〜の
  • :そして
  • 如何:どうやって,いかに
  • 程式:プログラム
  • 能夠:〜できる
  • 以及:そして
  • :〜と〜

 

そして,単語の意味をもとに意訳する。

意訳

「本書は主に機械学習の基礎的な内容をカバーしており,そして本書を読み終わった後,

  • どうやって機械学習と関連するプログラムを選ぶかについて,更によく理解できるようになる
  • プログラムを正式なオンライン環境に設置して一定の操作規模に達することにおいて,有効な認識を持つことができるようになる

ことだろう。」

 

このような感じで。

全文を訳するとキリがないので,各章のsummaryとなる文,および概念を要約した文のみを対象とする。

 

機械学習の概要について

本書は,機械学習の各手法について概説したのち,コード例を示す構成となっている。そこで本記事では機械学習の各手法について,モデル構造を中心に説明する。コード例は全て省略。

 

本書使用的數學符號(第二章より)

せっかくなので,中国語における数学的表現をいくつか見てみる。太字は中国語表現,( )内は英語表現。

 

 {\displaystyle \sum_{i=0}^n x_i}x_0からx_nまでの總和(sumtotal)

 

|x|x絕對值(absolute value)

 

{\displaystyle \sqrt 4}: 4平方根(square root)

 

z_k = \lt 0.5, 0.5 \gt(x, y) = (0.5, 0.5)向量(vector)

 

P(A)A機率(probability)

 

\{ 1,2,3 \} \cap \{ 1 \}:2つの集合の交集(interserection)

 

\{ 1,2,3 \} \cup \{ 1 \}:2つの集合の聯集(union)

 

det(C)矩陣(matrix)Cの行列式(determinant)

 

X^T:矩陣Xの轉罝矩陣(transposed matrix)

 

次回↓

 

ryosuke-okubo.hatenablog.com