從框架優(yōu)缺點(diǎn)說起，這是一份TensorFlow入門極簡(jiǎn)教程

taotao_2016 2018-05-24

展開全文

選自easy-tensorflow

機(jī)器之心編譯

參與：張倩、劉曉坤

隨著 TensorFlow 在研究及產(chǎn)品中的應(yīng)用日益廣泛，很多開發(fā)者及研究者都希望能深入學(xué)習(xí)這一深度學(xué)習(xí)框架。而在昨天機(jī)器之心發(fā)起的框架投票中，2144 位參與者中有 1441 位都在使用 TensorFlow 框架，是所有框架中使用率最高的。但 TensorFlow 這種靜態(tài)計(jì)算圖有一定的學(xué)習(xí)成本，因此也阻擋了很多準(zhǔn)備入坑的初學(xué)者。本文介紹了學(xué)習(xí) TensorFlow 的系列教程，旨在通過簡(jiǎn)單的理論與實(shí)踐幫助初學(xué)者一步步掌握 TensorFlow 的編程技巧。

這一系列教程分為 6 部分，從為什么選擇 TensorFlow 到卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)，介紹了初學(xué)者所需要的技能。機(jī)器之心在本文介紹了 PyTorch 和 Caffe 等深度學(xué)習(xí)框架的優(yōu)缺點(diǎn)及 TensorFlow 基礎(chǔ)，包括靜態(tài)計(jì)算圖、張量、TensorBoard 可視化和模型參數(shù)的保存等。

教程地址：http://www.

機(jī)器之心此前也介紹過很多 TensorFlow 的學(xué)習(xí)資源，讀者可結(jié)合這些資源閱讀該系列教程：

學(xué)習(xí)了！谷歌今日上線基于 TensorFlow 的機(jī)器學(xué)習(xí)速成課程（中文版）
機(jī)器之心 GitHub 項(xiàng)目：從零開始用 TensorFlow 搭建卷積神經(jīng)網(wǎng)絡(luò)
教程 | 從零開始：TensorFlow 機(jī)器學(xué)習(xí)模型快速部署指南
分布式 TensorFlow 入坑指南：從實(shí)例到代碼帶你玩轉(zhuǎn)多機(jī)器深度學(xué)習(xí)
三天速成！香港科技大學(xué) TensorFlow 課件分享
TensorFlow 從基礎(chǔ)到實(shí)戰(zhàn)：一步步教你創(chuàng)建交通標(biāo)志分類神經(jīng)網(wǎng)絡(luò)

為什么選擇 TensorFlow？

在本文中，我們將對(duì)比當(dāng)前最流行的深度學(xué)習(xí)框架（包括 Caffe、Theano、PyTorch、TensorFlow 和 Keras），幫助你為應(yīng)用選擇最合適的框架。

1. Caffe：第一個(gè)主流產(chǎn)品級(jí)深度學(xué)習(xí)庫，于 2014 年由 UC Berkeley 啟動(dòng)。

優(yōu)點(diǎn)：

快速
支持 GPU
漂亮的 Matlab 和 Python 接口

缺點(diǎn)：

不靈活。在 Caffe 中，每個(gè)節(jié)點(diǎn)被當(dāng)做一個(gè)層，因此如果你想要一種新的層類型，你需要定義完整的前向、后向和梯度更新過程。這些層是網(wǎng)絡(luò)的構(gòu)建模塊，你需要在無窮無盡的列表中進(jìn)行選擇。（相反，在 TensorFlow 中，每個(gè)節(jié)點(diǎn)被當(dāng)做一個(gè)張量運(yùn)算例如矩陣相加、相乘或卷積。你可以輕易地定義一個(gè)層作為這些運(yùn)算的組合。因此 TensorFlow 的構(gòu)建模塊更小巧，允許更靈活的模塊化。）
需要大量的非必要冗長(zhǎng)代碼。如果你希望同時(shí)支持 CPU 和 GPU，你需要為每一個(gè)實(shí)現(xiàn)額外的函數(shù)。你還需要使用普通的文本編輯器來定義你的模型。真令人頭疼！幾乎每個(gè)人都希望程序化地定義模型，因?yàn)檫@有利于不同組件之間的模塊化。有趣的是，Caffe 的主要架構(gòu)師現(xiàn)在在 TensorFlow 團(tuán)隊(duì)工作。
專一性。僅定位在計(jì)算機(jī)視覺（但做得很不錯(cuò)）。
不是以 Python 編寫！如果你希望引入新的變動(dòng)，你需要在 C++和 CUDA 上編程（對(duì)于更小的變動(dòng)，你可以使用它的 Python 和 Matlab 接口）。
糟糕的文檔。
安裝比較困難！有大量的依賴包。
只有少量種類的輸入格式，僅有一種輸出格式 HDF5（雖然你總是可以使用它的 Python/C++/Matlab 接口來運(yùn)行，并從中得到輸出數(shù)據(jù)）。
不適用于構(gòu)建循環(huán)網(wǎng)絡(luò)。

2. Theano：由蒙特利爾大學(xué)研究團(tuán)隊(duì)構(gòu)建。Theano 的頂層構(gòu)建了數(shù)值開源深度庫，包括 Keras、Lasagne 和 Blocks。Yoshua Bengio 在 2017 年 9 月 28 日宣布，Theano 的開發(fā)將終止。因此實(shí)際上 Theano 已死！

優(yōu)點(diǎn)：

計(jì)算圖的抽象很漂亮（可媲美 TensorFlow）
為 CPU 和 GPU 都做了優(yōu)化
很好地適應(yīng)數(shù)值優(yōu)化任務(wù)
高級(jí)封裝（Keras、Lasagne）

缺點(diǎn)：

原始的 Theano 只有比較低級(jí)的 API

import numpy
           for _ in range(T):
               h = torch.matmul(W, h) + b

大型模型可能需要很長(zhǎng)的編譯時(shí)間
不支持多 GPU
錯(cuò)誤信息可能沒有幫助（有時(shí)候令人懊惱）

3. Pytorch：2017 年 1 月，F(xiàn)acebook 將 Python 版本的 Torch 庫（用 Lua 編寫）開源。

優(yōu)點(diǎn)：

提供動(dòng)態(tài)計(jì)算圖（意味著圖是在運(yùn)行時(shí)生成的），允許你處理可變長(zhǎng)度的輸入和輸出，例如，在使用 RNN 時(shí)非常有用。
另一個(gè)例子是，在 PyTorch 中，可以使用標(biāo)準(zhǔn) Python 語法編寫 for 循環(huán)語句。
大量預(yù)訓(xùn)練模型
大量易于組合的模塊化組件
易于編寫自己的圖層類型，易于在 GPU 上運(yùn)行
「TensorBoard」缺少一些關(guān)鍵功能時(shí)，「Losswise」可以作為 Pytorch 的替代品

缺點(diǎn)：

正式文檔以外的參考資料/資源有限
無商業(yè)支持

4. TensorFlow: 由較低級(jí)別的符號(hào)計(jì)算庫（如 Theano）與較高級(jí)別的網(wǎng)絡(luò)規(guī)范庫（如 Blocks 和 Lasagne）組合而成。

優(yōu)點(diǎn)：

由谷歌開發(fā)、維護(hù)，因此可以保障支持、開發(fā)的持續(xù)性。
巨大、活躍的社區(qū)
網(wǎng)絡(luò)訓(xùn)練的低級(jí)、高級(jí)接口
「TensorBoard」是一款強(qiáng)大的可視化套件，旨在跟蹤網(wǎng)絡(luò)拓?fù)浜托阅?，使調(diào)試更加簡(jiǎn)單。
用 Python 編寫（盡管某些對(duì)性能有重要影響的部分是用 C++實(shí)現(xiàn)的），這是一種頗具可讀性的開發(fā)語言
支持多 GPU。因此可以在不同的計(jì)算機(jī)上自由運(yùn)行代碼，而不必停止或重新啟動(dòng)程序
比基于 Theano 的選項(xiàng)更快的模型編譯
編譯時(shí)間比 Theano 短
TensorFlow 不僅支持深度學(xué)習(xí)，還有支持強(qiáng)化學(xué)習(xí)和其他算法的工具。

缺點(diǎn)：

計(jì)算圖是純 Python 的，因此速度較慢
圖構(gòu)造是靜態(tài)的，意味著圖必須先被「編譯」再運(yùn)行

5. Keras：Keras 是一個(gè)更高級(jí)、對(duì)用戶最友好的 API，具有可配置的后端，由 Google Brain 團(tuán)隊(duì)成員 Francis Chollet 編寫和維護(hù)。

優(yōu)點(diǎn)：

提供高級(jí) API 來構(gòu)建深度學(xué)習(xí)模型，使其易于閱讀和使用
編寫規(guī)范的文檔
大型、活躍的社區(qū)
位于其他深度學(xué)習(xí)庫（如 Theano 和 TensorFlow，可配置）之上
使用面向?qū)ο蟮脑O(shè)計(jì)，因此所有內(nèi)容都被視為對(duì)象（如網(wǎng)絡(luò)層、參數(shù)、優(yōu)化器等）。所有模型參數(shù)都可以作為對(duì)象屬性進(jìn)行訪問。

例如：

model.layers[3].output 將提供模型的第三層
model.layers[3].weights 是符號(hào)權(quán)重張量的列表

缺點(diǎn)：

由于用途非常普遍，所以在性能方面比較欠缺
與 TensorFlow 后端配合使用時(shí)會(huì)出現(xiàn)性能問題（因?yàn)椴⑽瘁槍?duì)其進(jìn)行優(yōu)化），但與 Theano 后端配合使用時(shí)效果良好
不像 TensorFlow 或 PyTorch 那樣靈活

TensorFlow 基礎(chǔ)

TensorFlow 是一種采用數(shù)據(jù)流圖（data flow graphs），用于數(shù)值計(jì)算的開源軟件庫。其中 Tensor 代表傳遞的數(shù)據(jù)為張量（多維數(shù)組），F(xiàn)low 代表使用計(jì)算圖進(jìn)行運(yùn)算。數(shù)據(jù)流圖用「節(jié)點(diǎn)」（nodes）和「邊」（edges）組成的有向圖來描述數(shù)學(xué)運(yùn)算?！腹?jié)點(diǎn)」一般用來表示施加的數(shù)學(xué)操作，但也可以表示數(shù)據(jù)輸入的起點(diǎn)和輸出的終點(diǎn)，或者是讀取/寫入持久變量（persistent variable）的終點(diǎn)。邊表示節(jié)點(diǎn)之間的輸入/輸出關(guān)系。這些數(shù)據(jù)邊可以傳送維度可動(dòng)態(tài)調(diào)整的多維數(shù)據(jù)數(shù)組，即張量（tensor）。

計(jì)算圖與會(huì)話

學(xué)習(xí) TensorFlow 的第一步是了解它的主要特色——「計(jì)算圖」方法?；旧纤械?TensorFlow 代碼都包含兩個(gè)重要部分：

1. 創(chuàng)建「計(jì)算圖」，表示計(jì)算的數(shù)據(jù)流

2. 運(yùn)行「會(huì)話」，執(zhí)行圖中的運(yùn)算

事實(shí)上，TensorFlow 將計(jì)算的定義與其執(zhí)行分開。這兩個(gè)部分將在以下各節(jié)中詳細(xì)說明。在此之前，請(qǐng)記住第一步是導(dǎo)入 TensorFlow ！

import tensorflow as tf

這樣，Python 就可以訪問 TensorFlow 的所有類、方法和符號(hào)。使用此命令，TensorFlow 庫將在別名「tf」下導(dǎo)入，以便以后我們可以使用它而不必每次鍵入其全稱「TensorFlow」。

1. 計(jì)算圖

TensorFlow 的創(chuàng)意中的最大創(chuàng)意是數(shù)值計(jì)算被表達(dá)成計(jì)算圖。換種說法，任何 TensorFlow 程序的骨干都是一個(gè)計(jì)算圖。正如 TensorFlow 官網(wǎng)上提及的，「一個(gè)計(jì)算圖是被組織到圖節(jié)點(diǎn)上的一系列 TensorFlow 運(yùn)算」。

首先，什么是節(jié)點(diǎn)和運(yùn)算？最好的解釋方式是，舉個(gè)例子。假設(shè)我們?yōu)楹瘮?shù)「f(x,y)=x^2y+y+2」編寫代碼。TensorFlow 中的計(jì)算圖如下所示：

圖 2：TensorFlow 構(gòu)建的計(jì)算圖。

如上圖所示，計(jì)算圖有一系列由邊互相連接的節(jié)點(diǎn)構(gòu)成。每個(gè)節(jié)點(diǎn)稱為 op，即 operation（運(yùn)算）的縮寫。因此每個(gè)節(jié)點(diǎn)代表一個(gè)運(yùn)算，可能是張量運(yùn)算或生成張量的操作。每個(gè)節(jié)點(diǎn)以零或更多張量為輸入，并生成一個(gè)張量作為輸出。

現(xiàn)在我們來構(gòu)建一個(gè)簡(jiǎn)單的計(jì)算圖。

import tensorflow as tf
a = 2
b = 3
c = tf.add(a, b, name='Add')
print(c)
______________________________________________________
Tensor('Add:0', shape=(), dtype=int32)

生成的計(jì)算圖和變量為：

圖 3：左：生成的圖在 Tensorboard 中可視化；右：生成的變量（在 debug 模式下運(yùn)行時(shí)從 PyCharm 調(diào)試器獲取的屏幕截圖）

為了實(shí)際評(píng)估節(jié)點(diǎn)，必須在會(huì)話內(nèi)運(yùn)行計(jì)算圖。簡(jiǎn)言之，編寫的代碼只生成僅僅用來確定張量的預(yù)期大小以及對(duì)它們執(zhí)行的運(yùn)算的圖。但是，它不會(huì)為任何張量賦值。

因此，TensorFlow Graph 類似于 Python 中的函數(shù)定義。它「不會(huì)」為你執(zhí)行任何計(jì)算（就像函數(shù)定義不會(huì)有任何執(zhí)行結(jié)果一樣）。它「僅」定義計(jì)算操作。

2. 會(huì)話（Session）

在 TensorFlow 中，所有不同的變量和運(yùn)算都是儲(chǔ)存在計(jì)算圖。所以在我們構(gòu)建完模型所需要的圖之后，還需要打開一個(gè)會(huì)話（Session）來運(yùn)行整個(gè)計(jì)算圖。在會(huì)話中，我們可以將所有計(jì)算分配到可用的 CPU 和 GPU 資源中。舉個(gè)簡(jiǎn)單的例子，運(yùn)行計(jì)算圖并獲取 c 的值：

sess = tf.Session()
print(sess.run(c))
sess.close()
__________________________________________
5

這些代碼創(chuàng)建了一個(gè) Session() 對(duì)象（分配到 sess），然后（第二行）調(diào)用它的運(yùn)行方法來運(yùn)行足夠的計(jì)算圖以評(píng)估 c。計(jì)算完畢后需要關(guān)閉會(huì)話來幫助系統(tǒng)回收資源，不然就會(huì)出現(xiàn)資源泄漏的問題。

TensorFlow 張量

import tensorflow as tf

TensorFlow 中最基本的單位是常量（Constant）、變量（Variable）和占位符（Placeholder）。常量定義后值和維度不可變，變量定義后值可變而維度不可變。在神經(jīng)網(wǎng)絡(luò)中，變量一般可作為儲(chǔ)存權(quán)重和其他信息的矩陣，而常量可作為儲(chǔ)存超參數(shù)或其他結(jié)構(gòu)信息的變量。

1. 常量

創(chuàng)建一個(gè)節(jié)點(diǎn)取常數(shù)值，它接收以下的變量：

tf.constant(value, dtype=None, shape=None, name='Const', verify_shape=False)

我們來創(chuàng)建兩個(gè)常量并將它們加起來。常量張量可以通過定義一個(gè)值來簡(jiǎn)單地定義：

# create graph
a = tf.constant(2)
b = tf.constant(3)
c = a + b
# launch the graph in a session
with tf.Session() as sess:
    print(sess.run(c))
____________________________________________________
5

現(xiàn)在我們來看看創(chuàng)建的計(jì)算圖和生成的數(shù)據(jù)類型：

2. 變量

變量是狀態(tài)性的節(jié)點(diǎn)，輸出的是它們當(dāng)前的值，意味著它們可以在一個(gè)計(jì)算圖的多次執(zhí)行中保留它們的值。它們有一系列的有用特征，例如：

它們可以在訓(xùn)練期間或訓(xùn)練后保存到硬盤上。這允許來自不同公司和團(tuán)隊(duì)的人們保存、恢復(fù)和發(fā)送他們的模型參數(shù)給別人。

默認(rèn)情況下，梯度更新（在所有神經(jīng)網(wǎng)絡(luò)中應(yīng)用）將應(yīng)用到計(jì)算圖中的所有變量。實(shí)際上，變量是你希望調(diào)整以最小化損失函數(shù)的東西。

為了創(chuàng)建變量，你可以按如下方式使用 tf.Variable：

# Create a variable.
w = tf.Variable(, name=)

以下語句聲明一個(gè) 2 行 3 列的變量矩陣，該變量的值服從標(biāo)準(zhǔn)差為 1 的正態(tài)分布，并隨機(jī)生成。

w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))

TensorFlow 還有 tf.truncated_normal() 函數(shù)，即截?cái)嗾龖B(tài)分布隨機(jī)數(shù)，它只保留 [mean-2*stddev,mean+2*stddev] 范圍內(nèi)的隨機(jī)數(shù)。

調(diào)用 tf.Variable 來創(chuàng)建一個(gè)變量是一種老方法。TensorFlow 推薦使用封裝器 tf.get_variable，它能接收命名、形狀等參數(shù)：

tf.get_variable(name,
                shape=None,
                dtype=None,
                initializer=None,
                regularizer=None,
                trainable=True,
                collections=None,
                caching_device=None,
                partitioner=None,
                validate_shape=True,
                use_resource=None,
                custom_getter=None,
                constraint=None)

變量在使用前需要初始化。為此，我們必須調(diào)用「變量初始值設(shè)定項(xiàng)操作」，并在 session 上運(yùn)行該操作。

a = tf.get_variable(name='var_1', initializer=tf.constant(2))
b = tf.get_variable(name='var_2', initializer=tf.constant(3))
c = tf.add(a, b, name='Add1')

# launch the graph in a session
with tf.Session() as sess:
    # now let's evaluate their value
    print(sess.run(a))
    print(sess.run(b))
    print(sess.run(c))

3. 占位符

我們已經(jīng)創(chuàng)建了各種形式的常量和變量，但 TensorFlow 同樣還支持占位符。占位符并沒有初始值，它只會(huì)分配必要的內(nèi)存。在會(huì)話中，占位符可以使用 feed_dict 饋送數(shù)據(jù)。

feed_dict 是一個(gè)字典，在字典中需要給出每一個(gè)用到的占位符的取值。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)需要每次提供一個(gè)批量的訓(xùn)練樣本，如果每次迭代選取的數(shù)據(jù)要通過常量表示，那么 TensorFlow 的計(jì)算圖會(huì)非常大。因?yàn)槊吭黾右粋€(gè)常量，TensorFlow 都會(huì)在計(jì)算圖中增加一個(gè)節(jié)點(diǎn)。所以說擁有幾百萬次迭代的神經(jīng)網(wǎng)絡(luò)會(huì)擁有極其龐大的計(jì)算圖，而占位符卻可以解決這一點(diǎn)，它只會(huì)擁有占位符這一個(gè)節(jié)點(diǎn)。

a = tf.constant([5, 5, 5], tf.float32, name='A')
b = tf.placeholder(tf.float32, shape=[3], name='B')
c = tf.add(a, b, name='Add')

with tf.Session() as sess:
    # create a dictionary:
    d = {b: [1, 2, 3]}
    # feed it to the placeholder
    print(sess.run(c, feed_dict=d)) 
 ___________________________________________________
 [6. 7. 8.]

它生成的計(jì)算圖與變量如下所示：

現(xiàn)在，我們已經(jīng)能創(chuàng)建一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。如下利用隨機(jī)生成的數(shù)據(jù)創(chuàng)建了一個(gè)三層全連接網(wǎng)絡(luò)：

import tensorflow as tf
from numpy.random import RandomState

batch_size=10
w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))

# None 可以根據(jù)batch 大小確定維度，在shape的一個(gè)維度上使用None
x=tf.placeholder(tf.float32,shape=(None,2))
y=tf.placeholder(tf.float32,shape=(None,1))

#激活函數(shù)使用ReLU
a=tf.nn.relu(tf.matmul(x,w1))
yhat=tf.nn.relu(tf.matmul(a,w2))

#定義交叉熵為損失函數(shù)，訓(xùn)練過程使用Adam算法最小化交叉熵
cross_entropy=-tf.reduce_mean(y*tf.log(tf.clip_by_value(yhat,1e-10,1.0)))
train_step=tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

rdm=RandomState(1)
data_size=516

#生成兩個(gè)特征，共data_size個(gè)樣本
X=rdm.rand(data_size,2)
#定義規(guī)則給出樣本標(biāo)簽，所有x1+x2<>
Y = [[int(x1+x2 <>1)] for (x1, x2) in X]

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(w1))
    print(sess.run(w2))
    steps=11000
    for i in range(steps):

        #選定每一個(gè)批量讀取的首尾位置，確保在1個(gè)epoch內(nèi)采樣訓(xùn)練
        start = i * batch_size % data_size
        end = min(start + batch_size,data_size)
        sess.run(train_step,feed_dict={x:X[start:end],y:Y[start:end]})
        if i % 1000 == 0:
            training_loss= sess.run(cross_entropy,feed_dict={x:X,y:Y})
            print('在迭代 %d 次后，訓(xùn)練損失為 %g'%(i,training_loss))

上面的代碼定義了一個(gè)簡(jiǎn)單的三層全連接網(wǎng)絡(luò)（輸入層、隱藏層和輸出層分別為 2、3 和 2 個(gè)神經(jīng)元），隱藏層和輸出層的激活函數(shù)使用的是 ReLU 函數(shù)。該模型訓(xùn)練的樣本總數(shù)為 512，每次迭代讀取的批量為 10。這個(gè)簡(jiǎn)單的全連接網(wǎng)絡(luò)以交叉熵為損失函數(shù)，并使用 Adam 優(yōu)化算法進(jìn)行權(quán)重更新。

其中需要注意的幾個(gè)函數(shù)如 tf.nn.relu() 代表調(diào)用 ReLU 激活函數(shù)，tf.matmul() 為矩陣乘法等。tf.clip_by_value(yhat,1e-10,1.0) 這一語句代表的是截?cái)?yhat 的值，因?yàn)檫@一語句是嵌套在 tf.log() 函數(shù)內(nèi)的，所以我們需要確保 yhat 的取值不會(huì)導(dǎo)致對(duì)數(shù)無窮大。

TensorBoard 基礎(chǔ)

TensorBoard 是一個(gè)可視化軟件，在所有的 TensorFlow 標(biāo)準(zhǔn)安裝中都包含了 TensorBoard。按谷歌的話說：「使用 TensorFlow 執(zhí)行的計(jì)算，例如訓(xùn)練一個(gè)大規(guī)模深度神經(jīng)網(wǎng)絡(luò)，可能復(fù)雜且令人困惑。為了更加容易理解、調(diào)試和優(yōu)化 TensorFlow 程序，我們內(nèi)置了一套可視化工具，即 TensorBoard?！?/span>

TensorFlow 程序既能解決非常簡(jiǎn)單也能解決非常復(fù)雜的問題，它們都有兩種基本組件——運(yùn)算和張量。如前所述，你創(chuàng)建了一個(gè)由一系列運(yùn)算構(gòu)成的模型，饋送數(shù)據(jù)到模型上，張量將在運(yùn)算之間流動(dòng)，直到得到了輸出張量，即你的結(jié)果。

完全配置好后，TensorBoard 窗口將呈現(xiàn)與下圖類似的畫面：

TensorBoard 的創(chuàng)建是為了幫助你了解模型中張量的流動(dòng)，以便調(diào)試和優(yōu)化模型。它通常用于兩項(xiàng)任務(wù):

1. 圖形可視化

2. 編寫摘要（或可視化學(xué)習(xí)）

在本教程中，我們將介紹 TensorBoard 的上述兩項(xiàng)主要用法。盡早學(xué)習(xí)使用 TensorBoard，可以讓使用 TensorFlow 的工作更有趣也更有成效。

1. 計(jì)算圖可視化

強(qiáng)大的 TensorFlow 計(jì)算圖會(huì)變得極其復(fù)雜?？梢暬瘓D形有助于理解并對(duì)其進(jìn)行調(diào)試。這是一個(gè)在 TensorFlow 網(wǎng)站工作的可視化示例。

為了激活 TensorFlow 程序 TensorBoard，需要向其中添加幾行代碼。這將把 TensorFlow 運(yùn)算導(dǎo)出到一個(gè)名為「event file」（或 event log file）的文件中。TensorBoard 能夠讀取此文件并深入了解模型圖及其性能。

現(xiàn)在我們來編寫一個(gè)簡(jiǎn)單的 TensorFlow 程序，并用 TensorBoard 可視化其計(jì)算圖。先創(chuàng)建兩個(gè)常量并將其添加到一起。常數(shù)張量可以簡(jiǎn)單地通過定義它們的值來定義：

import tensorflow as tf

# create graph
a = tf.constant(2)
b = tf.constant(3)
c = tf.add(a, b)
# launch the graph in a session
with tf.Session() as sess:
    print(sess.run(c))
_____________________________________________
5

為了用 TensorBoard 可視化程序，我們需要編寫程序的日志文件。為了編寫事件文件，我們首先需要為那些日志編寫一個(gè) writer，使用以下代碼：

writer = tf.summary.FileWriter([logdir], [graph])

其中 [logdir] 是你想要保存那些日志文件的文件夾。你可以選擇 [logdir] 作為某些有意義的東西，例如『./graphs』。第二個(gè)參數(shù) [graph] 是我們正在編寫的程序的計(jì)算圖。有兩種獲取計(jì)算圖的方法：

1. 使用 tf.get_default_graph() 調(diào)用計(jì)算圖，返回程序的默認(rèn)計(jì)算圖

2. 將計(jì)算圖設(shè)置為 sess.graph，返回會(huì)話的計(jì)算圖（注意這里需要我們已經(jīng)創(chuàng)建了會(huì)話）

我們將在以下的例子中展示兩種方法。然而，第二種方法更加常用。不管用哪種方法，確保僅當(dāng)你定義了計(jì)算圖之后才創(chuàng)建一個(gè) writer。否則，TensorBoard 中可視化的計(jì)算圖將是不完整的。讓我們添加 writer 到第一個(gè)例子中并可視化計(jì)算圖。

import tensorflow as tf

# create graph
a = tf.constant(2)
b = tf.constant(3)
c = tf.add(a, b)

# creating the writer out of the session
# writer = tf.summary.FileWriter('./graphs', tf.get_default_graph())

# launch the graph in a session
with tf.Session() as sess:
    # or creating the writer inside the session
    writer = tf.summary.FileWriter('./graphs', sess.graph)
    print(sess.run(c))
    # don't forget to close the writer at the end
    writer.close()

接下來轉(zhuǎn)到 Terminal，確保當(dāng)前工作目錄與運(yùn)行 Python 代碼的位置相同。例如，此處我們可以使用以下代碼切換到目錄

$ cd ~/Desktop/tensorboard

接下來運(yùn)行：

$ tensorboard --logdir='./graphs' —port 6006

這將為你生成一個(gè)鏈接。ctrl+左鍵單擊該鏈接（或?qū)⑵鋸?fù)制到瀏覽器中，或只需打開瀏覽器并轉(zhuǎn)到 http://localhost:6006/）。接下來將顯示 TensorBoard 頁面，如下所示：

參數(shù)存儲(chǔ)與加載

在基礎(chǔ)部分中，最后還介紹了模型參數(shù)的保存與恢復(fù)。一般 TensorFlow 模型持久化可使用 tf.train.Saver() 完成，它會(huì)將 TensorFlow 模型保存為 .ckpt 格式的文件。一般該文件目錄下會(huì)有三個(gè)文件，第一個(gè) model.ckpt.meta 保存了 TensorFlow 計(jì)算圖的結(jié)構(gòu)，第二個(gè) model.ckpt 文件保存了 TensorFlow 中每一個(gè)變量的取值，而最后一個(gè) cheekpoint 文件保存了同目錄下所有的模型文件列表。

為了保存和恢復(fù)模型變量，我們需要在構(gòu)建計(jì)算圖后調(diào)用 tf.train.Saver()，例如：

# create the graph
X = tf.placeholder(..)
Y = tf.placeholder(..)
w = tf.get_variale(..)
b = tf.get_variale(..)
...
loss = tf.losses.mean_squared_error(..)
optimizer = tf.train.AdamOptimizer(..).minimize(loss)
...

saver = tf.tfain.Saver()

在訓(xùn)練模式中，我們需要打開會(huì)話初始化變量和運(yùn)行計(jì)算圖，并在訓(xùn)練結(jié)束時(shí)調(diào)用 saver.save() 保存變量：

# TRAIN
with tf.Session() as sess:
    sess.run(tf.globale_variables_initializer())
    # train our model
    for step in range(steps):
        sess.run(optimizer)
        ...
    saved_path = saver.save(sess, './my-model', global_step=step)

在測(cè)試模式中，我們需要使用 saver.restore() 恢復(fù)參數(shù)：

# TEST
with tf.Session() as sess:
    saver.restore(sess, './my-model')
    ...

當(dāng)然，模型持久化還有非常多的內(nèi)容，例如由 MetaGraphDef Protocol Buffer 定義的計(jì)算圖節(jié)點(diǎn)元數(shù)據(jù)。讀者可繼續(xù)閱讀完整的教程或其它書籍以了解詳細(xì)信息。

深度學(xué)習(xí)時(shí)代，傳統(tǒng) NLP 中的語言知識(shí)庫是否就不再有用了呢？在最新一期的 INTERFACE 中，清華大學(xué)劉知遠(yuǎn)副教授將為我們介紹在深度學(xué)習(xí)模型中應(yīng)用 HowNet 知識(shí)的探索和未來展望。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： taotao_2016 > 《計(jì)算機(jī)》

舉報(bào)/認(rèn)領(lǐng)