在什么情況下,Java比C++慢很多?
問:在什么情況下,Java 比 C++ 慢很多?
答:Ben Maurer:
為了回答這個問題,需要先將該問題分成幾個可能引起慢的原因:
垃圾回收器。這是一把“雙刃劍”。如果你的程序遵循“大部分對象都在年青代中消亡”模型,垃圾回收器是非常有利的(很少的碎片,更好的緩存局部性)。但是,如果程序不遵循該模型,JVM將花費很多資源來回收堆內(nèi)存。
大對象。在Java中,所有的對象都有一個vtable指針,而C++中使用POD結(jié)構(gòu)沒有額外開銷。此外,所有的Java對象是可以被鎖定的。其實現(xiàn)依賴于JVM,這可能需要在對象中增加額外的字段。大對象 == 緩存更少的對象 == 更慢。(另一方面,Java 7 用64位記錄壓縮后的指針,這也是造成該問題的一部分原因。
缺乏內(nèi)聯(lián)對象。在Java中,所有的類都是指針。在C++中,對象可以和其它對象一起分配,或者在棧上分配。這樣可以提高緩存的局部性,從而減少動態(tài)內(nèi)存分配的開銷。
平臺函數(shù)調(diào)用。在Java中,JNI的調(diào)用或者將對象編譯成本地代碼都會帶來不小的開銷。如果你需要頻繁調(diào)用客戶端的C++代碼,會增加很大的開銷。
低效的強制抽象。例如,在Java中字符串是不可變的。如果你想寫一個XML分析器,你只使用String對象(沒有char[]),它將會很慢,因為需要分配額外的空間。
虛函數(shù)調(diào)用增加。JVM中,幾乎所有的函數(shù)調(diào)用都是虛函數(shù)調(diào)用。有許多代碼嘗試避免虛函數(shù)調(diào)用,但是很多場景下,JVM無法解決這個問題。這阻礙了代碼的內(nèi)聯(lián),使代碼變慢。
缺乏高級的編譯特征及轉(zhuǎn)為匯編的能力。 如果你寫了一段能從匯編得益的代碼Java可能表現(xiàn)不佳。
在我看來,最大的問題是垃圾回收。在程序中,強制在大的內(nèi)存中進行多次完全GC,是最容易導(dǎo)致Java和C++之間產(chǎn)生鴻溝的原因之一。除此之外,如果將程序的工作集放在L2緩存之外,像大對象、缺乏內(nèi)聯(lián)對象等問題,也會導(dǎo)致兩者之間的巨大差別。
低效的強制抽象和平臺函數(shù)也會導(dǎo)致速度下降,但是這通常只會因為低級的代碼才會產(chǎn)生。如果你使用寫得很好的Java代碼庫,這通常不是什么大問題。
答:Todd Lipcon
我基本同意Ben Maurer(hey Ben?。┑幕卮?。有幾個小點不同:
在最新的JVM中,當(dāng)這種分配永遠(yuǎn)不會從(a)局部函數(shù)或(b)局部線程逃逸出去的時候,逃逸分析能有效地決定一種固定分配。也就是說當(dāng)分配不需要加鎖,通常是在自身的??臻g上進行的。這兩種情況下都是一種簡單的“指針碰撞(bump the pointer)”分配,這等同于C中的棧分配。
譯者注:
逃逸分析 Escape Analysis,是一種編譯優(yōu)化技術(shù),指分析指針動態(tài)范圍的方法。通俗地說,當(dāng)一個對象的指針被多個方法或線程引用時,我們稱這個指針發(fā)生了逃逸。指針碰撞(bump the point)。假設(shè)Java堆中內(nèi)存是絕對規(guī)整的,所有用過的內(nèi)存都被放在一邊,空閑的內(nèi)存被放在另一邊,中間放著一個指針作為分界點的指示器,那所分配內(nèi)存就僅僅是把那個指針向空閑空間那邊挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”。即使沒有逃逸分析,年青代的分配也是通過指針碰撞方式,在線程本地分配緩沖區(qū)(TLAB)中完成的,不需要進行同步。所以Java中小對象的分配有的時候比C語言實現(xiàn)的 malloc() 方式更快。更好的 malloc 方法像Google的 tcmalloc,采用了類似的方式。但是由于C語言無法在內(nèi)存中對分配后的對象重新分配,所以某些方面會受到限制。
雖然存在內(nèi)聯(lián)和虛函數(shù)問題,但是實際上,Java在某些情況下甚至可以做的比C更好。特別是,C不能通過動態(tài)鏈接功能來實現(xiàn)內(nèi)聯(lián),因為內(nèi)聯(lián)是在編譯時期進行的,而不是運行時期。而Java可越過不同的類或庫的邊界來動態(tài)內(nèi)聯(lián)一個函數(shù),即使該類的真正實現(xiàn)在編譯期間還不可用。許多工作中,這種方式比C++的虛函數(shù)調(diào)用更有效,C++虛函數(shù)調(diào)用總是需要調(diào)用虛表。而JIT編譯器,如果之前動態(tài)屬性已經(jīng)丟失(如新的類已經(jīng)被加載),能夠聰明地取消內(nèi)聯(lián)優(yōu)化。
新版本的GCC提供一些這方面優(yōu)化,稱為“全程序優(yōu)化”或“鏈接時優(yōu)化”(http://gcc.gnu.org/wiki/LinkTime…),允許在工程范圍內(nèi)越過對象文件進行內(nèi)聯(lián)。但是,基本上還是不允許通過動態(tài)鏈接的方式來實現(xiàn)內(nèi)聯(lián)(如通過內(nèi)聯(lián)的方式實現(xiàn)zlib的調(diào)用等)。許多大型項目都是通過復(fù)制標(biāo)準(zhǔn)庫的功能到它們的代碼中來實現(xiàn)。
原文鏈接: quora 翻譯: ImportNew.com
