乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

<output id="e9wm2"></output>

<s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

<object id="jgfbo"><tt id="jgfbo"></tt></object>

<menu id="jgfbo"></menu>

<address id="jgfbo"></address>

搜索

分享

QQ空間 QQ好友新浪微博微信

使用Ollama實現(xiàn)本地部署大模型

netouch 2024-05-02 發(fā)布于北京

展開全文

打開Ollama的官網(wǎng)，整個網(wǎng)頁上就只有一句顯眼的話：Get up and running with large language models, locally. 中文意思是：在本地快速上手并運行大型語言模型。

1 什么是 Ollama？

Ollama 是一種假設(shè)存在的本地大模型運行框架，允許用戶在自己的硬件環(huán)境中輕松部署和使用大規(guī)模預(yù)訓(xùn)練模型。

1.1 Ollama 特性概覽：

易用性與廣泛支持：
Ollama具有良好的生態(tài)支持，可以兼容不同架構(gòu)的大語言模型，截至今天（2024年3月20日），Ollama官網(wǎng)上公開支持的大模型就有70個之多。
量化與推理能力：
提供了對模型的量化和推理優(yōu)化能力，這使得模型能夠在有限計算資源下進行高效推理，并且能夠近乎無縫地遷移至相同架構(gòu)的開源大模型上。
安全、快速、穩(wěn)定的服務(wù)：
使用Ollama，個人開發(fā)者或企業(yè)可以在不依賴云端的情況下，在本地設(shè)備上實現(xiàn)大模型的服務(wù)化，從而滿足隱私保護、實時響應(yīng)或其他特定需求。

1.2 Ollama 資源網(wǎng)址

官網(wǎng)：https:///
Gtihub：https://github.com/ollama/ollama

2 安裝 Ollama

訪問 Ollama 下載地址：https:///download
1）macOS 版本
圖1 下載 Ollama macOS 版本

圖1 下載 Ollama macOS 版本
注意上圖底部的 macOS 版本，請檢查是否具備安裝要求。

點擊下方的“Download for macOS”按鈕，下載安裝文件的zip壓縮包。打開解壓縮后生成的文件 ollama.app，直接執(zhí)行即可完成安裝并運行。在終端窗口里輸入：

ollama --version

返回版本信息即表示安裝完成并正在運行。

2） Windows 版本
圖2 下載 Ollama Winsows 版本

圖2 下載 Ollama Winsows 版本
請注意，目前 Windows 版本為預(yù)覽版，切要求系統(tǒng)為 Windows 10 以上。

點擊下方的“Download for Windows（preview）”按鈕，下載 .exe 可執(zhí)行安裝文件。
執(zhí)行下載的文件，安裝過程中殺毒軟件提示有病毒，關(guān)閉殺毒軟件，或者將提示的執(zhí)行文件加入信任白名單，即可完成安裝和運行。

打開 cmd 窗口，在命令行輸入執(zhí)行：

ollama --version

如果返回版本信息，即表示安裝成功！

3 使用 Ollama

Windows 和 macOS 在使用上幾乎沒有區(qū)別。訪問 Ollama 官網(wǎng)，列舉了很多大模型，我們可以從中找一個模型進行測試：
圖3 選擇或搜索模型

圖3 選擇或搜索模型
在首頁右側(cè)點擊 Models 連接，可以看到列舉的可以使用的大模型，當(dāng)然也可以通過其左邊的搜索框進行搜索。
找個參數(shù)少一點的模型先測試一下，就下載“通義千問”的 qwen:0.5b-chat 模型，在 cmd 里輸入下面的命令：

ollama pull qwen:0.5b-chat

下載完成后，運行此模型，在 cmd 中輸入下面的命令：

ollama run qwen:0.5b-chat

簡單測試一些，可以運行了：
圖4 在 Ollama 工具里運行和使用指定的模型

圖3 選擇或搜索模型
0.5b 的參數(shù)，效果也確實只能呵呵了?？吹浆F(xiàn)在，您應(yīng)該也會了，你可以下個 qwen:1.8b-fp16 或 gemma:2b 試試。

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： netouch > 《我的圖書館》

舉報/認(rèn)領(lǐng)

0條評論

請遵守用戶評論公約

類似文章 更多

netouch

關(guān)注對話

TA的最新館藏

智能化技術(shù)引領(lǐng)新一輪科技革命
Dolma：包含三萬億Token的語言模型預(yù)訓(xùn)練研究開放語料庫-CSDN博客
如何讀懂bitcoin的代碼
超詳細(xì)的【區(qū)塊鏈】技術(shù)介紹整理（七千余字九大板塊）
AIGC軍事大模型評估體系框架研究
企業(yè)數(shù)字化轉(zhuǎn)型：流程、架構(gòu)與賦能

喜歡該文的人也喜歡更多

熱門閱讀換一換