我們都知道,微服務(wù)之間通過feign傳遞,在復(fù)雜的微服務(wù)架構(gòu)系統(tǒng)中,幾乎每一個(gè)前端請(qǐng)求都會(huì)形成一個(gè)復(fù)雜的分布式服務(wù)調(diào)用鏈路,在每條鏈路中任何一個(gè)依賴服務(wù)出現(xiàn)延遲超時(shí)或者錯(cuò)誤都有可能引起整個(gè)請(qǐng)求最后的失敗。當(dāng)業(yè)務(wù)流程足夠復(fù)雜時(shí),一個(gè)完整的HTTP請(qǐng)求調(diào)用鏈一般會(huì)經(jīng)過多個(gè)微服務(wù)系統(tǒng),要通過日志來跟蹤一整個(gè)調(diào)用鏈變得不再那么簡(jiǎn)單。通過sleuth可以很方便的看出每個(gè)采集請(qǐng)求的耗時(shí)情況,分析出哪些服務(wù)調(diào)用比較耗時(shí),當(dāng)服務(wù)調(diào)用的耗時(shí)隨著請(qǐng)求量的增大而增大時(shí),可以針對(duì)業(yè)務(wù)做一些優(yōu)化措施。所以我們可以通過我們可以通過Spring Cloud Sleuth來解決這個(gè)問題。這里我們將演示如何通過Spring Cloud Sleuth來追蹤這個(gè)過程,并借助Zipkin以圖形化界面的方式展示。 展示之前,分別介紹一下rabbitmq、sleuth、zinkip。
-
rabbitmq
- RabbitMQ是實(shí)現(xiàn)了高級(jí)消息隊(duì)列協(xié)議(AMQP)的開源消息代理軟件(亦稱面向消息的中間件)。RabbitMQ服務(wù)器是用Erlang語言編寫的,而群集和故障轉(zhuǎn)移是構(gòu)建在開放電信平臺(tái)框架上的。所有主要的編程語言均有與代理接口通訊的客戶端庫。
-
sleuth和zinkip
- sleuth 是spring cloud的組成部分之一,為springcloud應(yīng)用實(shí)現(xiàn)了一種分布式追蹤解決方案,其兼容了zinkip,HTrace和log-based追蹤
- Zipkin 是一款開源的分布式實(shí)時(shí)數(shù)據(jù)追蹤系統(tǒng)(Distributed Tracking System),基于 Google Dapper 的論文設(shè)計(jì)而來,由 Twitter公司開發(fā)貢獻(xiàn)。其主要功能是聚集來自各個(gè)異構(gòu)系統(tǒng)的實(shí)時(shí)監(jiān)控?cái)?shù)據(jù),用來追蹤微服務(wù)架構(gòu)下的系統(tǒng)延時(shí)問題。Zipkin 的用戶界面可以呈現(xiàn)一幅關(guān)聯(lián)圖表,以顯示有多少被追蹤的請(qǐng)求通過了每一層應(yīng)用。Zipkin 以 Trace 結(jié)構(gòu)表示對(duì)一次請(qǐng)求的追蹤,又把每個(gè) Trace 拆分為若干個(gè)有依賴關(guān)系的 Span。在微服務(wù)架構(gòu)中,一次用戶請(qǐng)求可能會(huì)由后臺(tái)若干個(gè)服務(wù)負(fù)責(zé)處理,那么每個(gè)處理請(qǐng)求的服務(wù)就可以理解為一個(gè) Span(可以包括 API 服務(wù),緩存服務(wù),數(shù)據(jù)庫服務(wù)以及報(bào)表服務(wù)等)。當(dāng)然這個(gè)服務(wù)也可能繼續(xù)請(qǐng)求其他的服務(wù),因此 Span 是一個(gè)樹形結(jié)構(gòu),以體現(xiàn)服務(wù)之間的調(diào)用關(guān)系。Zipkin 的用戶界面除了可以查看 Span 的依賴關(guān)系之外,還以瀑布圖的形式顯示了每個(gè) Span 的耗時(shí)情況,可以一目了然的看到各個(gè)服務(wù)的性能狀況。
sleuth中的一些術(shù)語
- Span:基本工作單元,例如,在一個(gè)新建的span中發(fā)送一個(gè)RPC等同于發(fā)送一個(gè)回應(yīng)請(qǐng)求給RPC,span通過一個(gè)64位ID唯一標(biāo)識(shí),trace以另一個(gè)64位ID表示,span還有其他數(shù)據(jù)信息,比如摘要、時(shí)間戳事件、關(guān)鍵值注釋(tags)、span的ID、以及進(jìn)度ID(通常是IP地址) ,span在不斷的啟動(dòng)和停止,同時(shí)記錄了時(shí)間信息,當(dāng)你創(chuàng)建了一個(gè)span,你必須在未來的某個(gè)時(shí)刻停止它。
- Trace:一系列spans組成的一個(gè)樹狀結(jié)構(gòu),例如,如果你正在跑一個(gè)分布式工程,你可能需要?jiǎng)?chuàng)建一個(gè)trace。
- Annotation:用來及時(shí)記錄一個(gè)事件的存在,一些核心annotations用來定義一個(gè)請(qǐng)求的開始和結(jié)束
- cs - Client Sent -客戶端發(fā)起一個(gè)請(qǐng)求,這個(gè)annotion描述了這個(gè)span的開始
- sr - Server Received -服務(wù)端獲得請(qǐng)求并準(zhǔn)備開始處理它,如果將其sr減去cs時(shí)間戳便可得到網(wǎng)絡(luò)延遲
- ss - Server Sent -注解表明請(qǐng)求處理的完成(當(dāng)請(qǐng)求返回客戶端),如果ss減去sr時(shí)間戳便可得到服務(wù)端需要的處理請(qǐng)求時(shí)間
- cr - Client Received -表明span的結(jié)束,客戶端成功接收到服務(wù)端的回復(fù),如果cr減去cs時(shí)間戳便可得到客戶端從服務(wù)端獲取回復(fù)的所有所需時(shí)間
接下來就開始搭建
這里cloud版本用的Greenwich.SR1,boot使用的是2.1.6
1.在pom.xml中 引入sleuth依賴
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>
2.模擬兩個(gè)日志 這兩個(gè)服務(wù)之間通過feign調(diào)用,由test調(diào)用system,這里本來有一個(gè)注冊(cè)中心,這里就不在演示了
test模塊
@Slf4j
@RestController
public class TestController {
@Autowired
private IHelloService helloService;
@GetMapping("hello")
public String hello(String name) {
log.info("Feign調(diào)用system的/hello服務(wù)");
return this.helloService.hello(name);
}
}
在test模塊的service包下創(chuàng)建IHelloService
@FeignClient(value = "system",contextId = "helloServiceClient")
public interface IHelloService {
@GetMapping("hello")
String hello(@RequestParam("name") String name);
}
system 模塊
@Slf4j
@RestController
public class TestController {
@GetMapping("hello")
public String hello(String name) {
log.info("/hello服務(wù)被調(diào)用");
return "hello" + name;
}
}
3.訪問接口 localhost:8202/test/hello?name=sleuth:會(huì)出現(xiàn)兩個(gè)我們自定義的日志
啟動(dòng)的時(shí)候查看test模塊產(chǎn)生的
2019-08-23 14:22:51.774 INFO [test,72bb0469bee07104,72bb0469bee07104,false] 22728 --- [nio-8202-exec-1] c.m.f.s.test.controller.TestController : Feign調(diào)用system的/hello服務(wù)
啟動(dòng)的時(shí)候查看system模塊產(chǎn)生的
2019-08-23 14:22:52.469 INFO [system,72bb0469bee07104,43597a6edded6f2e,false] 812 --- [nio-8201-exec-2] c.m.f.s.s.controller.TestController : /hello服務(wù)被調(diào)用
可以看到,日志里出現(xiàn)了[Test,72bb0469bee07104,72bb0469bee07104,false]信息,這些信息由Spring Cloud Sleuth生成,用于跟蹤微服務(wù)請(qǐng)求鏈路。這些信息包含了4個(gè)部分的值,它們的含義如下:
- system微服務(wù)的名稱,與spring.application.name對(duì)應(yīng);
- 72bb0469bee07104稱為Trace ID,在一條完整的請(qǐng)求鏈路中,這個(gè)值是固定的。觀察上面的日志即可證實(shí)這一點(diǎn);
- 43597a6edded6f2e稱為Span ID,它表示一個(gè)基本的工作單元;
- false表示是否要將該信息輸出到Zipkin等服務(wù)中來收集和展示,這里我們還沒有集成Zipkin,所以為false。
下面我們來整合Zipkin
在整合Zipkin之前,我們需要先搭建RabbitMQ。RabbitMQ用于收集Sleuth提供的追蹤信息,然后Zipkin Server從RabbitMQ里獲取,這樣可以提升性能。
在安裝RabbitMQ之前,需要先安裝Erlang/OTP,下載地址為:http://www./downloads/,下載exe文件安裝即可。
安裝完畢后,下載RabbitMQ,下載地址為 :
http://www./install-windows.html,下載exe文件安裝即可。
安裝完RabbitMQ之后,我們到RabbitMQ安裝目錄的sbin下執(zhí)行如下命令
rabbitmq-plugins enable rabbitmq_management
然后在瀏覽器中輸入http://localhost:15672,默認(rèn)用戶名和密碼都是guest,登錄后可看到:

點(diǎn)擊Admin Tab頁面,新增一個(gè)用戶:

用戶名為febs,密碼為123456,角色為管理員。新添加的用戶還是No access狀態(tài),需要進(jìn)一步對(duì)該用戶進(jìn)行授權(quán)后,方可以遠(yuǎn)程通過該用戶名訪問。點(diǎn)擊該新增用戶名。進(jìn)入授權(quán)頁面,點(diǎn)擊Set permission按鈕,進(jìn)行用戶授權(quán)操作。
安裝好RabbitMQ后,我們開始整合Zipkin。在較低版本的Spring Cloud中,我們可以自己搭建Zipkin Server,現(xiàn)在我們只能使用官方搭建好的Zipkin Server,地址為:https://github.com/openzipkin/zipkin
在cmd窗口下運(yùn)行下面這條命令(windows下沒有curl環(huán)境的話,可以在git bash中運(yùn)行這條命令),下載zipkin.jar:
curl -sSL https:///quickstart.sh | bash -s
如果下載速度極慢,可以復(fù)制鏈接到迅雷下載中下載,下載后重命名為zipkin.jar即可。
zipkin支持將追蹤信息保存到MySQL數(shù)據(jù)庫,所以在運(yùn)行zipkin.jar之前,我們先準(zhǔn)備好相關(guān)庫表,SQL腳本地址為:
https://github.com/openzipkin/zipkin/blob/master/zipkin-storage/mysql-v1/src/main/resources/mysql.sql。
庫表準(zhǔn)備好后,運(yùn)行下面這條命令啟動(dòng)zipkin.jar:
java -jar zipkin.jar --server.port=8402 --zipkin.storage.type=mysql --zipkin.storage.mysql.db=febs_cloud_base --zipkin.storage.mysql.username=root --zipkin.storage.mysql.password=123456 --zipkin.storage.mysql.host=localhost --zipkin.storage.mysql.port=3306 --zipkin.collector.rabbitmq.addresses=localhost:5672 --zipkin.collector.rabbitmq.username=febs --zipkin.collector.rabbitmq.password=123456
上面命令指定了數(shù)據(jù)庫鏈接和RabbitMQ鏈接信息。更多可選配置可以解壓zipkin.jar,查看zipkin\BOOT-INF\classes路徑下的zipkin-server-shared.yml配置類源碼。
啟動(dòng)好zipkin.jar后,在對(duì)應(yīng)模塊的pom里引入如下依賴:
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-zipkin</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.amqp</groupId>
<artifactId>spring-rabbit</artifactId>
</dependency>
修改對(duì)應(yīng)模塊的application.yml
spring:
zipkin:
sender:
type: rabbit
sleuth:
sampler:
probability: 1
rabbitmq:
host: localhost
port: 5672
username: febs
password: 123456
spring.zipkin.sender.type指定了使用RabbitMQ收集追蹤信息;
spring.sleuth.sampler.probability默認(rèn)值為0.1,即采樣率才1/10,發(fā)送10筆請(qǐng)求只有一筆會(huì)被采集。為了測(cè)試方便,我們可以將它設(shè)置為1,即100%采樣;
spring.rabbitmq用于配置RabbitMQ連接信息,你可能會(huì)問,為什么剛剛RabbitMQ端口是15672,這里卻配置為5672,是不是寫錯(cuò)了呢?其實(shí)不是,15672是RabbitMQ的管理頁面端口,5672是AMPQ端口。
添加好配置后,啟動(dòng)system和test模塊,發(fā)送一筆localhost:8202/test/hello?name=夏天請(qǐng)求后,使用瀏覽器訪問http://localhost:8402/zipkin/鏈接,然后點(diǎn)擊圖中所示



查看依賴關(guān)系:

查看數(shù)據(jù)表,看是否存儲(chǔ)了信息:

|