java連接字符串有多種方式,比如+操作符, StringBuilder.append
方法,這些方法各有什么優(yōu)劣(可以適當(dāng)說(shuō)明各種方式的實(shí)現(xiàn)細(xì)節(jié))?
按照高效的原則,那么java中字符串連接的最佳實(shí)踐是什么?
有關(guān)字符串處理,都有哪些其他的最佳實(shí)踐?
廢話不多說(shuō),直接開(kāi)始, 環(huán)境如下:
JDK版本: 1.8.0_65
CPU: i7 4790`
內(nèi)存: 16G
直接使用 +
拼接
看下面的代碼:
在上面的代碼中,我們使用加號(hào)來(lái)連接四個(gè)字符串,這種字符串拼接的方式優(yōu)點(diǎn)很明顯: 代碼簡(jiǎn)單直觀,但是對(duì)比 StringBuilder
和 StringBuffer
在 大部分情況下
比后者都低,這里說(shuō)是 大部分情況下
,我們用javap工具對(duì)上面代碼生成的字節(jié)碼進(jìn)行反編譯看看在編譯器對(duì)這段代碼做了什么。

從反編譯的結(jié)果來(lái)看,實(shí)際上對(duì)字符串使用 +
操作符進(jìn)行拼接,編譯器會(huì)在編譯階段把代碼優(yōu)化成使用 StringBuilder
類,并調(diào)用 append
方法進(jìn)行字符串拼接,最后調(diào)用 toString
方法,這樣看來(lái)是否可以認(rèn)為在一般情況下 其實(shí)直接使用+,反正編譯器也會(huì)幫我優(yōu)化為使用StringBuilder
?
StringBuilder
源碼分析
答案自然是 不可以
的,原因就在于 StringBuilder
這個(gè)類它內(nèi)部做了些什么時(shí)。
我們看一看 StringBuilder
類的構(gòu)造器

StringBuilder
提供了4個(gè)默認(rèn)的構(gòu)造器, 除了無(wú)參構(gòu)造函數(shù)外,還提供了另外3個(gè)重載版本,而內(nèi)部都調(diào)用父類的 super(int capacity)
構(gòu)造方法,它的父類是 AbstractStringBuilder
,構(gòu)造方法如下:

可以看到實(shí)際上StringBuilder內(nèi)部使用的是 char數(shù)組
來(lái)存儲(chǔ)數(shù)據(jù)(String、StringBuffer也是),這里 capacity
的值指定了數(shù)組的大小。結(jié)合 StringBuilder
的無(wú)參構(gòu)造函數(shù),可以知道默認(rèn)的大小是 16
個(gè)字符。
也就是說(shuō)如果待拼接的字符串總長(zhǎng)度不小于16的字符的話,那么其實(shí)直接拼接和我們手動(dòng)寫(xiě)StringBuilder區(qū)別不大,但是我們自己構(gòu)造StringBuilder類可以指定數(shù)組的大小,避免分配過(guò)多的內(nèi)存。
現(xiàn)在我們?cè)倏纯?StringBuilder.append
方法內(nèi)部做了什么事:
直接調(diào)用的父類的 append方法
:
在這個(gè)方法內(nèi)部調(diào)用了 ensureCapacityInternal
方法,當(dāng)拼接后的字符串總大小大于內(nèi)部數(shù)組 value
的大小時(shí),就必須先擴(kuò)容才能拼接,擴(kuò)容的代碼如下:

StringBuilder
在擴(kuò)容時(shí)把容量增大到 當(dāng)前容量的兩倍+2
,這是很可怕的,如果在構(gòu)造的時(shí)候沒(méi)有指定容量,那么很有可能在擴(kuò)容之后占用了浪費(fèi)大量的內(nèi)存空間。其次擴(kuò)容后還調(diào)用了 Arrays.copyOf
方法,這個(gè)方法把擴(kuò)容前的數(shù)據(jù)復(fù)制到擴(kuò)容后的空間內(nèi),這樣做的原因是: StringBuilder
內(nèi)部使用 char數(shù)組
存放數(shù)據(jù),java的數(shù)組是不可擴(kuò)容的,所以只能重新申請(qǐng)一片內(nèi)存空間,并把已有的數(shù)據(jù)復(fù)制到新的空間去,這里它最終調(diào)用了 System.arraycopy
方法來(lái)復(fù)制,這是一個(gè)native方法,底層直接操作內(nèi)存,所以比我們用循環(huán)來(lái)復(fù)制要塊的多,即便如此,大量申請(qǐng)內(nèi)存空間和復(fù)制數(shù)據(jù)帶來(lái)的影響也不可忽視。
使用 +
拼接和使用 StringBuilder
比較
上面這段代碼經(jīng)過(guò)優(yōu)化后相當(dāng)于:
一眼就能看出 創(chuàng)建了太多的StringBuilder對(duì)象
,而且在每次循環(huán)過(guò)后str越來(lái)越大,導(dǎo)致每次申請(qǐng)的內(nèi)存空間越來(lái)越大,并且當(dāng)str長(zhǎng)度大于16時(shí),每次都要擴(kuò)容兩次!而實(shí)際上 toString
方法在創(chuàng)建 String
對(duì)象時(shí),調(diào)用了 Arrays.copyOfRange
方法來(lái)復(fù)制數(shù)據(jù),此時(shí)相當(dāng)于每執(zhí)行一次,擴(kuò)容了兩次,復(fù)制了3次數(shù)據(jù),這樣的代價(jià)是相當(dāng)高的。

這段代碼的執(zhí)行時(shí)間在我的機(jī)器上都是0ms(小于1ms)和1ms,而上面那段代碼則大約在380ms!效率的差距相當(dāng)明顯。
同樣是上面的代碼,將循環(huán)次數(shù)調(diào)整為 1000000
時(shí),在我的機(jī)器上,有指定 capacity
時(shí)耗時(shí)大約20ms,沒(méi)有指定 capacity
時(shí)耗時(shí)大約29ms,這個(gè)差距雖然和直接使用 +
操作符有了很大的提升(且循環(huán)次數(shù)增大了100倍),但是它依舊會(huì)觸發(fā)多次擴(kuò)容和復(fù)制。
將上面的代碼改成使用 StringBuffer
,在我的機(jī)器上,耗時(shí)大約為33ms,這是因?yàn)?StringBuffer
在大部分方法上都加上了 synchronized
關(guān)鍵字來(lái)保證線程安全,執(zhí)行效率有一定程度上的降低。
使用 String.concat
拼接
現(xiàn)在再看這段代碼:
這段代碼使用了 String.concat
方法,在我的機(jī)器上,執(zhí)行時(shí)間大約為130ms,雖然直接相加要好的多,但是比起使用 StringBuilder
還要太多了,似乎沒(méi)什么用。其實(shí)并不是,在很多時(shí)候,我們只需要連接兩個(gè)字符串,而不是多個(gè)字符串的拼接,這個(gè)時(shí)候使用 String.concat
方法比 StringBuilder
要簡(jiǎn)潔且效率要高。

上面這段是 String.concat
的源碼,在這個(gè)方法中,調(diào)用了一次Arrays.copyOf,并且指定了 len + otherLen
,相當(dāng)于分配了一次內(nèi)存空間,并分別從str1和str2各復(fù)制一次數(shù)據(jù)。而如果使用 StringBuilder
并指定 capacity
,相當(dāng)于分配一次內(nèi)存空間,并分別從str1和str2各復(fù)制一次數(shù)據(jù),最后因?yàn)檎{(diào)用了 toString
方法,又復(fù)制了一次數(shù)據(jù)。
結(jié)論
現(xiàn)在根據(jù)上面的分析和測(cè)試可以知道:
Java中字符串拼接不要直接使用 +
拼接。
使用StringBuilder或者StringBuffer時(shí),盡可能準(zhǔn)確地估算capacity,并在構(gòu)造時(shí)指定,避免內(nèi)存浪費(fèi)和頻繁的擴(kuò)容及復(fù)制。
在沒(méi)有線程安全問(wèn)題時(shí)使用 StringBuilder
, 否則使用 StringBuffer
。
兩個(gè)字符串拼接直接調(diào)用 String.concat
性能最好。
關(guān)于 String
的其他最佳實(shí)踐:
用 equals
時(shí)總是把能確定不為空的變量寫(xiě)在左邊,如使用 ''.equals(str)
判斷空串,避免空指針異常。
第二點(diǎn)是用來(lái)排擠第一點(diǎn)的.. 使用 str != null && str.length() != 0
來(lái)判斷空串,效率比第一點(diǎn)高。
在需要把其他對(duì)象轉(zhuǎn)換為字符串對(duì)象時(shí),使用 String.valueOf(obj)
而不是直接調(diào)用 obj.toString()
方法,因?yàn)榍罢咭呀?jīng)對(duì)空值進(jìn)行檢測(cè)了,不會(huì)拋出空指針異常。
使用 String.format()
方法對(duì)字符串進(jìn)行格式化輸出。
在JDK 7及以上版本,可以在 switch
結(jié)構(gòu)中使用字符串了,所以對(duì)于較多的比較,使用 switch
代替 if-else
。
我暫時(shí)想的起來(lái)的就這么幾個(gè)了.. 請(qǐng)大家?guī)兔ρa(bǔ)充補(bǔ)充...