Java字符串的構造和拼接

發布時間：2021-09-16 23:28:57 來源：億速云閱讀：178 作者：chen 欄目：大數據

這篇文章主要講解了“Java字符串的構造和拼接”，文中的講解內容簡單清晰，易于學習與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學習“Java字符串的構造和拼接”吧！

2.1 構造字符串

字符串在Java里是不可變的，無論是構造，還是截取，得到的總是一個新字符串。看一下構造一個字符串源碼

private final char value[];
public String(String original) {
  this.value = original.value;
  this.hash = original.hash;
}

原有的字符串的value數組直接通過引用賦值給新的字符串value，也就是倆個字符串共享一個char數組，因此這種構造方法有著最快的構造。Java里的String對象被設計為不可變。意思是指一旦程序獲得了字符串對象引用，不必擔心這個字符串在別的地方被修改，不可變意味著線程安全，在第三章對不可變對象線程安全性又說明。

構造字符串更多的情況構造字符串是通過一個字符串數組，或者在某些框架的反序列化，使用byte[] 來構造字符串，這種情況下性能會非常低。如下是通過char[]數組構造一個新的字符串源碼

public String(char value[]) {
  this.value = Arrays.copyOf(value, value.length);
}

Arrays.copyOf 會重新拷貝一份新的數組，方法如下

public static char[] copyOf(char[] original, int newLength) {
  char[] copy = new char[newLength];
  System.arraycopy(original, 0, copy, 0,
                   Math.min(original.length, newLength));
  return copy;
}

可以看到通過數組構造字符串實際上是會創建一個新的字符串數組。如果不這樣，還是直接引用char數組，那么外部如果更改char數組，則這個新的字符串就被改變了。

char[] cs = new char[]{'a','b'};
String str = new String(cs);
cs[0] ='!'

上面的代碼最后一行，修改了cs數組，但不會影響str。因為str實際上是新的字符串數組構成

通過char數組構造新的字符串是最長用的方法，我們后面看到幾乎每個字符串API，都會調用這個方法構造新的字符串，比如subString,concat等方法。如下代碼驗證了通過字符串構造新的字符串，以及使用char數組構造字符串性能比較

String str= "你好，String";
char[] chars = str.toCharArray();

[@Benchmark](https://my.oschina.net/u/3268003)
public String string(){
  return new String(str);
}

[@Benchmark](https://my.oschina.net/u/3268003)
public String stringByCharArray(){
  return new String(chars);
}

輸出按照ns/op來輸出，既每次調用所用的納秒數，可以看到通過char構造字符串還是先當耗時的，特別如果是數組特別長，那更加耗時

Benchmark                                  Mode     Score    Units     
c.i.c.c.NewStringTest.string               avgt     4.235    ns/op     
c.i.c.c.NewStringTest.stringByCharArray    avgt    11.704    ns/op

通過字節構造字符串，是一種非常常見的情況，尤其現在分布式和微服務流行，字符串在客戶端序列化成字節數組，并發送給你給服務器端，服務器端會有一個反序列化，通過byte構造字符串

如下測試使用byte構造字符串性能測試

byte[] bs = "你好，String".getBytes("UTF-8");

[@Benchmark](https://my.oschina.net/u/3268003)
public String stringByByteArray() throws Exception{
  return new String(bs,"UTF-8");
}

測試結果可以看到byte構造字符串太耗時了，尤其是當要構造的字符串非常長的時候

Benchmark                                  Mode    Score    Units       
c.i.c.c.NewStringTest.string               avgt    4.649    ns/op       
c.i.c.c.NewStringTest.stringByByteArray    avgt   82.166    ns/op       
c.i.c.c.NewStringTest.stringByCharArray    avgt   12.138    ns/op

通過字節數組構造字符串，主要涉及到轉碼過程，內部會調用 StringCoding.decode轉碼

this.value = StringCoding.decode(charsetName, bytes, offset, length);

charsetName表示字符集，bytes是字節數組，offset和length表示字節數組

實際負責轉碼的是Charset子類，比如sun.nio.cs.UTF_8的decode方法負責實現字節轉碼，如果在深入到這個類，你會發現，你看到的是冰上一角，冰上下面這是一個相當耗CPU計算轉碼的工作，屬于無法優化的部分.

在我多次的系統性能優化過程中，都會發現通過字節數據組構造字符串總是排在消耗CPU比較靠前的位置，轉碼消耗的系統性能抵得上百行的業務代碼。因此我們系統在設計到分布式的，需要仔細設計需要傳輸的字段，盡量避免用String。比如時間可以用long類型來表示，業務狀態也可以用int來表示。如下需要序列化的對象

public class OrderResponse{
  //訂單日期，格式'yyyy-MM-dd'
  private String createDate;
  //訂單狀態,"0"表示正常
  private String status;
}

可以改進成更好的定義，以減小序列化和反序列化負擔。

public class OrderResponse{
  //訂單日期
  private long  createDate;
  //訂單狀態,0表示正常
  private int status;
}

關于在微服務中，序列化和反序列化傳輸對象，會在第四章和五章再次介紹對象的序列化

2.2 字符串拼接

JDK會自動將使用+號做的字符串拼接自動轉化為StringBuilder,如下代碼：

String a="hello";
String b ="world "
String str=a+b;

虛擬機會編譯成如下代碼

String str = new StringBuilder().append(a).append(b).toString();

如果你運行JMH測試這倆段代碼，性能其實一樣的，因為使用+連接字符串是一個常見操作，虛擬機對如上倆個代碼片段都會做一些優化，虛擬使用-XX:+OptimizeStringConcat 打開字符串拼接優化，（默認情況下是打開的)。如果采用以下代碼，雖然看是跟上面的代碼片段差不多，但虛擬機無法識別這種字符串拼接模式，性能會下降很多

StringBuilder sb = new StringBuilder();
sb.append(a);
sb.append(b);

運行StringConcatTest類，代碼如下

String a = "select u.id,u.name from user  u";
String b="  where u.id=? "   ;
[@Benchmark](https://my.oschina.net/u/3268003)
public String concat(){
  String c = a+b;
  return c ;

}

[@Benchmark](https://my.oschina.net/u/3268003)
public String concatbyOptimizeBuilder(){
  String c = new StringBuilder().append(a).append(b).toString();
  return c;
}


@Benchmark
public String concatbyBuilder(){
  //不會優化
  StringBuilder sb = new StringBuilder();
  sb.append(a);
  sb.append(b);
  return sb.toString();
}

有如下結果說明了虛擬機優化起了作用

Benchmark                                           Mode    Score    Units         
c.i.c.c.StringConcatTest.concat                     avgt   25.747    ns/op         
c.i.c.c.StringConcatTest.concatbyBuilder            avgt   90.548    ns/op         
c.i.c.c.StringConcatTest.concatbyOptimizeBuilder    avgt   21.904    ns/op

可以看到concatbyBuilder是最慢的，因為沒有被JVM優化

這里說的JVM優化，指的是虛擬機JIT優化，我們會在第8章JIT優化說明

讀者可以自己驗證一下a+b+c這種字符串拼接性能，看一下是否被優化了

同StringBuilder類似的還有StringBuffer，主要功能都繼承AbstractStringBuilder，提供了線程安全方法，比如append方法，使用了synchronized關鍵字

@Override
public synchronized StringBuffer append(String str) {
  //忽略其他代碼
  super.append(str);
  return this;
}

幾乎所有場景字符串拼接都不涉及到線程同步，因此StringBuffer已經很少使用了，如上的字符串拼接例子使用StringBuffer，

  @Benchmark
  public String concatbyBuffer(){
    StringBuffer sb = new StringBuffer();
    sb.append(a);
    sb.append(b);
    return sb.toString();
  }

輸出如下

Benchmark                                           Mode      Score   Units
c.i.c.c.StringConcatTest.concatbyBuffer             avgt    111.417   ns/op
c.i.c.c.StringConcatTest.concatbyBuilder            avgt     94.758   ns/op

可以看到，StringBuffer拼接性能跟StringBuilder相比性能并不差，這得益于虛擬機的"逃逸分析"，也就是JIT在打開逃逸分析情況以及鎖消除的情況下，有可能消除該對象上的使用synchronzied限定的鎖。

逃逸分析 -XX:+DoEscapeAnalysis和鎖消除-XX:+EliminateLocks，詳情參考本書第8章JIT優化

如下是一個鎖消除的例子，對象obj只在方法內部使用，因此可以消除synchronized

void foo() {
  //創建一個對象
  Object obj = new Object(); 
  synchronized (obj) {
    doSomething();
  }
}

程序不應該依賴JIT的優化，盡管打開了逃逸分析和鎖消除，但不能保證所有代碼都會被優化，因為鎖消除是在JIT的C2階段優化的，作為程序員，應該在無關線程安全情況下，使用StringBuilder。

使用StringBuilder 拼接其他類型，尤其是數字類型，則性能會明顯下降，這是因為數字類型轉字符在JDK內部，需要做很多工作，一個簡單的Int類型轉為字符串，需要至少50行代碼完成。我們在第一章已經看到過了，這里不再詳細說明。當你用StringBuilder來拼接字符串，拼接數字的時候，你需要思考，是否需要一個這樣的字符串。

2.10 BigDecimal

我們都知道浮點型變量在進行計算的時候會出現丟失精度的問題。如下一段代碼

System.out.println(0.05 + 0.01);
System.out.println(1.0 - 0.42);

輸出： 0.060000000000000005 0.5800000000000001

可以看到在Java中進行浮點數運算的時候，會出現丟失精度的問題。那么我們如果在進行商品價格計算的時候，就會出現問題。很有可能造成我們手中有0.06元，卻無法購買一個0.05元和一個0.01元的商品。因為如上所示，他們兩個的總和為0.060000000000000005。這無疑是一個很嚴重的問題，尤其是當電商網站的并發量上去的時候，出現的問題將是巨大的。可能會導致無法下單，或者對賬出現問題。

通常有倆個方法來解決這種問題，如果能用long來表示賬戶余額以分為單位，這是效率最高的。如果不能，則只能使用BigDecimal類來解決這類問題。

BigDecimal a = new BigDecimal("0.05");
BigDecimal b = new BigDecimal("0.01");
BigDecimal ret = a.add(b);
System.out.println(ret.toString());

通過字符串來構造BigDecimal，才能保證精度不丟失，如果使用new BigDecimal(0.05)，則因為0.05本身精度丟失，使得構造出來的BigDecimal也丟失精度。

BigDecimal能保證精度，但計算會有一定性能影響，如下是測試余額計算，用long表示分，用BigDecimal表示元的性能對比

BigDecimal a = new BigDecimal("0.05");
BigDecimal b = new BigDecimal("0.01");
long c = 5;
long d = 1;

@Benchmark
@CompilerControl(CompilerControl.Mode.DONT_INLINE)
public long addByLong() {
  return (c + d);
}
@Benchmark
@CompilerControl(CompilerControl.Mode.DONT_INLINE)
public BigDecimal addByBigDecimal() {
  return a.add(b);
}

在我的機器行，上面代碼都能進行精確計算，通過JMH，測試結果如下

Benchmark                                 Mode   Score    Units    
c.i.c.c.BigDecimalTest.addByBigDecimal    avgt   8.373    ns/op    
c.i.c.c.BigDecimalTest.addByLong          avgt   2.984    ns/op

感謝各位的閱讀，以上就是“Java字符串的構造和拼接”的內容了，經過本文的學習后，相信大家對Java字符串的構造和拼接這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關知識點的文章，歡迎關注！

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Java字符串的構造和拼接

2.1 構造字符串

2.2 字符串拼接

2.10 BigDecimal

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

Java字符串的構造和拼接

2.1 構造字符串

2.2 字符串拼接

2.10 BigDecimal

猜你喜歡

最新資訊

相關推薦

相關標簽