หน้านี้อธิบายวิธีแก้ไขข้อบกพร่องของการเก็บข้อมูลขยะใน Android Runtime (ART) (GC) ปัญหาด้านความถูกต้องและประสิทธิภาพ ซึ่งจะอธิบายวิธีใช้การยืนยัน GC ระบุวิธีแก้ปัญหาที่ยืนยันไม่สำเร็จของ GC และวัดผล จัดการปัญหาด้านประสิทธิภาพ GC
หากต้องการทำงานกับ ART โปรดดูหน้าเว็บใน ART และ Dalvik นี้ และรูปแบบ Dalvik Executable สำหรับความช่วยเหลือเพิ่มเติมในการยืนยันลั��ษณะการทำงานของแอป โปรดดูที่ กำลังยืนยัน พฤติกรรมของแอปในรันไทม์ (ART) ของ Android
ภาพรวมของ ART GC
ART มีแผน GC ที่แตกต่างกัน 2-3 รายการซึ่งประกอบด้วยการเรียกใช้ขยะที่แตกต่างกัน นักสะสม เริ่มตั้งแต่ Android 8 (Oreo) แพ็กเกจเริ่มต้นคือการคัดลอกพร้อมกัน (CC) แผน GC อีกแผนคือ Mark Sweep (CMS) แบบพร้อมกัน
ลักษณะเด่นบางประการของ GC การคัดลอกพร้อมกัน ได้แก่:
- CC ช่วยให้สามารถใช้ตัวจัดสรร Bump Pointer ที่เรียกว่า RegionTLAB การดำเนินการนี้จะจัดสรรชุดข้อความในพื้นที่ บัฟเฟอร์การจัดสรร (TLAB) ให้กับเทรดแอปแต่ละรายการ ซึ่งจะจัดสรรออบเจ็กต์ออกจาก TLAB ได้ ด้วยการกดปุ่ม "ด้านบน" ตัวชี้เมาส์ได้อย่างง่ายดาย โดยไม่ต้องซิงค์ใดๆ
- CC จะจัดระเบียบฮีปโดยคัดลอกออบเจ็กต์พร้อมกันโดยไม่หยุดเทรดของแอปชั่วคราว ซึ่งทำได้โดยอาศัยเกณฑ์แบ่งการอ่านที่ดักจับการอ่านจาก ฮีปโดยที่นักพัฒนาแอปไม่ต้องดำเนินการใดๆ
- GC มีการหยุดชั่วคราวเล็กน้อยเพียงครั้งเดียว ซึ่งคงที่ตามเวลาที่เกี่ยวกับขนาดของฮีป
- CC จะขยายได้เป็น GC สำหรับรุ่นใน Android 10 ขึ้นไป ทำให้สามารถเก็บรวบรวม ของเด็กๆ ซึ่งมักจะเข้าถึงไม่ได้ในเวลาไม่นานโดยแทบไม่ต้องทำอะไรเลย วิธีนี้ช่วย โดยเพิ่มอัตราการส่งข้อมูล GC และชะลอความต้องการในการผลิต GC แบบเต็มฮีปได้อย่างมาก
GC อื่นที่ ART ยังรองรับอยู่คือ CMS ช่วงเวลานี้ GC รองรับการบีบอัดด้วย แต่ไม่รองรับพร้อมกัน จะไม่มีการบดอัดจนกว่าแอป ทำงานในพื้นหลัง ซึ่งในขณะที่เทรดแอปถูกหยุดชั่ว��ราวเพื่อทำการบีบอัด การบดอัดยังจำเป็นเมื่อจัดสรรออบเจ็กต์ไม่สำเร็จเนื่องจากการกระจายตัว ด้วยวิธีนี้ อาจเป็นไปได้ว่าแอปไม่ตอบสนองเป็นระยะเวลาหนึ่ง
เนื่องจาก CMS ไม่ค่อยมีการย่อตัว ออบเจ็กต์แบบอิสระจึงอาจไม่ต่อเนื่องกัน จึงใช้ ตัวจัดสรรตามรายการฟรีที่เรียกว่า RosAlloc มีต้นทุนการจัดสรรสูงกว่าเมื่อเทียบกับ ลงใน RegionTLAB สุดท้าย อันเนื่องมาจากการแบ่งส่วนภายในทำให้การใช้งานหน่วยความจำสำหรับฮีป Java สำหรับ CMS อาจสูงกว่า CC
ตัวเลือกการยืนยัน GC และประสิทธิภาพ
เปลี่ยนประเภท GC
OEM เปลี่ยนประเภท GC ได้ กระบวนการเปลี่ยนแปลง
เกี่ยวข้องกับการตั้งค่าตัวแปรสภาพแวดล้อม ART_USE_READ_BARRIER
ในเวลาบิลด์
ค่าเริ่มต้นคือจริง ซึ่งจะเปิดใช้ตัวรวบรวม CC เนื่องจากใช้อุปสรรคการอ่าน สำหรับ CMS
ควรตั้งค่าเป็น "เท็จ" ไว้อย่างชัดเจน
โดยค่าเริ่มต้น เครื่องมือรวบรวม CC จะทำงานในโหมดการสร้างใน Android 10 ขึ้นไป ถึง
ปิดใช้โหมดการสร้าง อาร์กิวเมนต์บรรทัดคำสั่ง -Xgc:nogenerational_cc
อาจเป็น
คุณสามารถตั้งค่าพร็อพเพอร์ตี้ของระบบได้ดังนี้
adb shell setprop dalvik.vm.gctype nogenerational_ccเครื่องมือรวบรวม CMS จะทำงานในโหมดการสร้างเสมอ
ยืนยันฮีป
การยืนยันฮีปอาจเป็นตัวเลือก GC ที่มีประโยชน์มากที่สุดสำหรับการแก้ไขข้อบกพร่อง
ข้อผิดพลาดเกี่ยวกับ GC หรือฮีปเสียหาย การเปิดใช้การยืนยันฮีปจะทำให้ GC
เพื่อตรวจสอบความถูกต้องของฮีปในบางจุดระหว่างถังขยะ
ขั้นตอนการเก็บรวบรวม การยืนยันฮีปมีตัวเลือกเดีย��กับ
เปลี่ยนประเภท GC หากเปิดใช้ การยืนยันฮีปจะยืนยันรากและ
ทำให้มั่นใจว่าออบเจ็กต์ที่เข้าถึงได้จะอ้างอิงเฉพาะออบเจ็กต์ที่เข้าถึงได้อื่นๆ เท่านั้น GC
เปิดใช้การยืนยันได้โดยการส่งผ่านค่า -Xgc
ต่อไปนี้
- หากเปิดใช้
[no]preverify
จะดำเนินการตรวจสอบฮีปก่อนเริ่ม GC - หากเปิดใช้
[no]presweepingverify
จะทำการยืนยันฮีป ก่อนจะเริ่มขั้นตอนการเก็บขยะ - หากเปิดใช้
[no]postverify
จะทำการยืนยันฮีปหลังจาก GC กวาดเสร็จแล้ว [no]preverify_rosalloc
,[no]postsweepingverify_rosalloc
และ[no]postverify_rosalloc
คือตัวเลือก GC เพิ่มเติมที่ยืนยันว่า เฉพาะสถานะบัญชีภายในของ RosAlloc เท่านั้น ดังนั้นจึงใช้ได้เฉพาะกับ เครื่องมือรวบรวม CMS ซึ่งใช้ตัวจัดสรร RosAlloc สิ่งหลักๆ ที่ได้รับการยืนยันแล้วมีดังนี้ ว่าค่าเวทมนตร์ตรงกับค่าคงที่ที่คาดไว้ บล็อกหน่วยความจำที่ว่างอยู่ ลงทะเบียนในแผนที่ของfree_page_runs_
แล้ว
ประสิทธิภาพ
การวัดประสิทธิภาพของ GC มีเครื่องมือหลัก 2 อย่าง ได้แก่ จังหวะเวลาของ GC dumps และ Systrace นอกจากนี้ยังมี Systrace เวอร์ชันขั้นสูงที่เรียกว่า Perfetto ด้วย วิธีวัดปัญหาด้านประสิทธิภาพ GC แบบเห็นภาพ คือการใช้ Systrace และ Perfetto เพื่อดูว่า GC ใดทำให้มีการหยุดชั่วคราวเป็นเวลานาน หรือ การขัดจังหวะชั่วคราวของแอป แม้ว่า ART GC จะมีการปรับปรุงให้ดีขึ้นอย่างมากเมื่อเวลาผ่านไป แต่การเปลี่ยนแปลงที่ไม่ดี พฤติกรรม เช่น การจัดสรรมากเกินไป อาจทำให้เกิดปัญหาด้านประสิทธิภาพ
กลยุทธ์คอลเล็กชัน
CC GC รวบรวมโดยการเรียกใช้ GC รุ่นเยาว์หรือ GC แบบเต็มฮีป ตามหลักแล้วเด็ก GC ได้รับการเรียกใช้บ่อยกว่า GC จะทำคอลเล็กชัน CC ที่มีอายุน้อยจนถึงอัตราการส่งข้อมูล (คำนวณตามไบต์ อิสระ/วินาทีของระยะเวลา GC) ของรอบการเก็บรวบรวมภาพที���เพิ่งเสร็จสิ้นนั้นน้อยกว่าอัตราการส่งข้อมูลเฉลี่ย จากคอลเล็กชัน CC เต็มรูปแบบ เมื่อเกิดกรณีนี้ขึ้น ระบบจะเลือก CC แบบเต็มฮีปสำหรับ GC พร้อมกัน แทนที่จะเป็น CC สำหรับอายุน้อย หลังจากคอลเล็กชันฮีปเต็มรูปแบบเสร็จสมบูรณ์แล้ว GC เปลี่ยนกลับไปเป็น CC ปัจจัยสำคัญอย่างหนึ่งที่ทำให้กลยุทธ์นี้ใช้ได้ผลคือ CC ไม่ปรับขีดจำกัดของฮีปฟุตพริ้นท์หลังจากที่สร้างเสร็จแล้ว ซึ่งทำให้ CC อายุน้อยเกิดขึ้นมากกว่า และบ่อยขึ้นจนกระทั่งอัตราการส่งข้อมูลต่ำกว่า CC แบบเต็มฮีป ซึ่งทำให้ฮีปเพิ่มขึ้น
ใช้ SIGQUIT เพื่อรับข้อมูลประสิทธิภาพ GC
หากต้องการรับเวลาประสิทธิภาพของ GC สำหรับแอป โปรดส่ง SIGQUIT
ไปที่
ใช้งานแอปอยู่แล้วหรือบัตรใน -XX:DumpGCPerformanceOnShutdown
เป็น dalvikvm
เมื่อเริ่มโปรแกรมบรรทัดคำสั่ง เมื่อแอปได้รับ
สัญญาณคำขอ ANR (SIGQUIT
) ส่งออกข้อมูลที่เกี่ยวข้องกับล็อก
สแต็กเทรดและประสิทธิภาพของ GC
หากต้องการรับดัมพ์ของเวลา GC ให้ใช้
adb shell kill -s QUIT PID
การดำเนินการนี้จะสร้างไฟล์ (ที่มีวันที่และเวลาในชื่อ เช่น anr_2020-07-13-19-23-39-817)
ใน /data/anr/
ช่วงเวลานี้
มีดัมพ์ ANR บางรายการ รวมถึงการกำหนดเวลา GC คุณสามารถค้นหา
การจับเวลา GC โดยการค้นหาการทิ้งช่วงเวลา Gc สะสม เวลาเหล่านี้
แสดงข้อมูลบางอย่างที่คุณอาจสนใจ รวมถึงข้อมูลฮิสโตแกรมสำหรับ
ระยะและการหยุดชั่วคราวของ GC แต่ละประเภท ช่วงหยุดพักมักจะสำคัญกว่าการพิจารณา
เวลา เช่น
young concurrent copying paused: Sum: 5.491ms 99% C.I. 1.464ms-2.133ms Avg: 1.830ms Max: 2.133ms
แสดงว่าการหยุดไว้ชั่วคราวโด��เฉลี่ยคือ 1.83 มิลลิวินาที ซึ่งควรจะต่ำพอ ก็จะไม่ทำให้แอปส่วนใหญ่พลาดเฟรม และไม่ต้องกังวล
จุดที่น่าสนใจอีกอย่างคือ ช่วงเวลาที่ควรระงับ ซึ่งมาตรการที่ ระยะเวลาที่ชุดข้อความจะไปถึงจุดระงับหลังจาก GC ขอ โทรศัพท์จะถูกระงับ เวลานี้รวมอยู่ในการหยุด GC ชั่วคราว ดังนั้นจึงเป็นประโยชน์ที่ พิจารณาว่าการหยุดชั่วคราวเป็นเวลานานเกิดจาก GC ทำงานช้าหรือเทรด การระงับเกิดขึ้นอย่างช้าๆ ตัวอย่างช่วงเวลาปกติในการระงับมีดังนี้ บน Nexus 5
suspend all histogram: Sum: 1.513ms 99% C.I. 3us-546.560us Avg: 47.281us Max: 601us
มีด้านอื่นๆ ที่น่าสนใจ เช่น เวลาที่ใช้ไปทั้งหมดและ GC อัตราการส่งข้อมูล ตัวอย่าง
Total time spent in GC: 502.251ms Mean GC size throughput: 92MB/s Mean GC object throughput: 1.54702e+06 objects/s
ต่อไปนี้เป็นตัวอย่างวิธีถ่ายโอนเวลา GC ของแอปที่ทำงานอยู่แล้ว
adb shell kill -s QUIT PID
adb pull /data/anr/anr_2020-07-13-19-23-39-817
ขณะนี้เวลาของ GC อยู่ในระยะของ anr_2020-07-13-19-23-39-817
ต่อไปนี้คือตัวอย่างเอาต์พุต
จาก Google Maps:
Start Dumping histograms for 2195 iterations for concurrent copying MarkingPhase: Sum: 258.127s 99% C.I. 58.854ms-352.575ms Avg: 117.651ms Max: 641.940ms ScanCardsForSpace: Sum: 85.966s 99% C.I. 15.121ms-112.080ms Avg: 39.164ms Max: 662.555ms ScanImmuneSpaces: Sum: 79.066s 99% C.I. 7.614ms-57.658ms Avg: 18.014ms Max: 546.276ms ProcessMarkStack: Sum: 49.308s 99% C.I. 6.439ms-81.640ms Avg: 22.464ms Max: 638.448ms ClearFromSpace: Sum: 35.068s 99% C.I. 6.522ms-40.040ms Avg: 15.976ms Max: 633.665ms SweepSystemWeaks: Sum: 14.209s 99% C.I. 3.224ms-15.210ms Avg: 6.473ms Max: 201.738ms CaptureThreadRootsForMarking: Sum: 11.067s 99% C.I. 0.835ms-13.902ms Avg: 5.044ms Max: 25.565ms VisitConcurrentRoots: Sum: 8.588s 99% C.I. 1.260ms-8.547ms Avg: 1.956ms Max: 231.593ms ProcessReferences: Sum: 7.868s 99% C.I. 0.002ms-8.336ms Avg: 1.792ms Max: 17.376ms EnqueueFinalizerReferences: Sum: 3.976s 99% C.I. 0.691ms-8.005ms Avg: 1.811ms Max: 16.540ms GrayAllDirtyImmuneObjects: Sum: 3.721s 99% C.I. 0.622ms-6.702ms Avg: 1.695ms Max: 14.893ms SweepLargeObjects: Sum: 3.202s 99% C.I. 0.032ms-6.388ms Avg: 1.458ms Max: 549.851ms FlipOtherThreads: Sum: 2.265s 99% C.I. 0.487ms-3.702ms Avg: 1.031ms Max: 6.327ms VisitNonThreadRoots: Sum: 1.883s 99% C.I. 45us-3207.333us Avg: 429.210us Max: 27524us InitializePhase: Sum: 1.624s 99% C.I. 231.171us-2751.250us Avg: 740.220us Max: 6961us ForwardSoftReferences: Sum: 1.071s 99% C.I. 215.113us-2175.625us Avg: 488.362us Max: 7441us ReclaimPhase: Sum: 490.854ms 99% C.I. 32.029us-6373.807us Avg: 223.623us Max: 362851us EmptyRBMarkBitStack: Sum: 479.736ms 99% C.I. 11us-3202.500us Avg: 218.558us Max: 13652us CopyingPhase: Sum: 399.163ms 99% C.I. 24us-4602.500us Avg: 181.851us Max: 22865us ThreadListFlip: Sum: 295.609ms 99% C.I. 15us-2134.999us Avg: 134.673us Max: 13578us ResumeRunnableThreads: Sum: 238.329ms 99% C.I. 5us-2351.250us Avg: 108.578us Max: 10539us ResumeOtherThreads: Sum: 207.915ms 99% C.I. 1.072us-3602.499us Avg: 94.722us Max: 14179us RecordFree: Sum: 188.009ms 99% C.I. 64us-312.812us Avg: 85.653us Max: 2709us MarkZygoteLargeObjects: Sum: 133.301ms 99% C.I. 12us-734.999us Avg: 60.729us Max: 10169us MarkStackAsLive: Sum: 127.554ms 99% C.I. 13us-417.083us Avg: 58.111us Max: 1728us FlipThreadRoots: Sum: 126.119ms 99% C.I. 1.028us-3202.499us Avg: 57.457us Max: 11412us SweepAllocSpace: Sum: 117.761ms 99% C.I. 24us-400.624us Avg: 53.649us Max: 1541us SwapBitmaps: Sum: 56.301ms 99% C.I. 10us-125.312us Avg: 25.649us Max: 1475us (Paused)GrayAllNewlyDirtyImmuneObjects: Sum: 33.047ms 99% C.I. 9us-49.931us Avg: 15.055us Max: 72us (Paused)SetFromSpace: Sum: 11.651ms 99% C.I. 2us-49.772us Avg: 5.307us Max: 71us (Paused)FlipCallback: Sum: 7.693ms 99% C.I. 2us-32us Avg: 3.504us Max: 32us (Paused)ClearCards: Sum: 6.371ms 99% C.I. 250ns-49753ns Avg: 207ns Max: 188000ns Sweep: Sum: 5.793ms 99% C.I. 1us-49.818us Avg: 2.639us Max: 93us UnBindBitmaps: Sum: 5.255ms 99% C.I. 1us-31us Avg: 2.394us Max: 31us Done Dumping histograms concurrent copying paused: Sum: 315.249ms 99% C.I. 49us-1378.125us Avg: 143.621us Max: 7722us concurrent copying freed-bytes: Avg: 34MB Max: 54MB Min: 2062KB Freed-bytes histogram: 0:4,5120:5,10240:19,15360:69,20480:167,25600:364,30720:529,35840:405,40960:284,46080:311,51200:38 concurrent copying total time: 569.947s mean time: 259.657ms concurrent copying freed: 1453160493 objects with total size 74GB concurrent copying throughput: 2.54964e+06/s / 134MB/s per cpu-time: 157655668/s / 150MB/s Average major GC reclaim bytes ratio 0.486928 over 2195 GC cycles Average major GC copied live bytes ratio 0.0894662 over 2199 major GCs Cumulative bytes moved 6586367960 Cumulative objects moved 127490240 Peak regions allocated 376 (94MB) / 2048 (512MB) Start Dumping histograms for 685 iterations for young concurrent copying ScanCardsForSpace: Sum: 26.288s 99% C.I. 8.617ms-77.759ms Avg: 38.377ms Max: 432.991ms ProcessMarkStack: Sum: 21.829s 99% C.I. 2.116ms-71.119ms Avg: 31.868ms Max: 98.679ms ClearFromSpace: Sum: 19.420s 99% C.I. 5.480ms-50.293ms Avg: 28.351ms Max: 507.330ms ScanImmuneSpaces: Sum: 9.968s 99% C.I. 8.155ms-30.639ms Avg: 14.552ms Max: 46.676ms SweepSystemWeaks: Sum: 6.741s 99% C.I. 3.655ms-14.715ms Avg: 9.841ms Max: 22.142ms GrayAllDirtyImmuneObjects: Sum: 4.466s 99% C.I. 0.584ms-14.315ms Avg: 6.519ms Max: 24.355ms FlipOtherThreads: Sum: 3.672s 99% C.I. 0.631ms-16.630ms Avg: 5.361ms Max: 18.513ms ProcessReferences: Sum: 2.806s 99% C.I. 0.001ms-9.459ms Avg: 2.048ms Max: 11.951ms EnqueueFinalizerReferences: Sum: 1.857s 99% C.I. 0.424ms-8.609ms Avg: 2.711ms Max: 24.063ms VisitConcurrentRoots: Sum: 1.094s 99% C.I. 1.306ms-5.357ms Avg: 1.598ms Max: 6.831ms SweepArray: Sum: 711.032ms 99% C.I. 0.022ms-3.502ms Avg: 1.038ms Max: 7.307ms InitializePhase: Sum: 667.346ms 99% C.I. 303us-2643.749us Avg: 974.227us Max: 3199us VisitNonThreadRoots: Sum: 388.145ms 99% C.I. 103.911us-1385.833us Avg: 566.635us Max: 5374us ThreadListFlip: Sum: 202.730ms 99% C.I. 18us-2414.999us Avg: 295.956us Max: 6780us EmptyRBMarkBitStack: Sum: 132.934ms 99% C.I. 8us-1757.499us Avg: 194.064us Max: 8495us ResumeRunnableThreads: Sum: 109.593ms 99% C.I. 6us-4719.999us Avg: 159.989us Max: 11106us ResumeOtherThreads: Sum: 86.733ms 99% C.I. 3us-4114.999us Avg: 126.617us Max: 19332us ForwardSoftReferences: Sum: 69.686ms 99% C.I. 14us-2014.999us Avg: 101.731us Max: 4723us RecordFree: Sum: 58.889ms 99% C.I. 0.500us-185.833us Avg: 42.984us Max: 769us FlipThreadRoots: Sum: 58.540ms 99% C.I. 1.034us-4314.999us Avg: 85.459us Max: 10224us CopyingPhase: Sum: 52.227ms 99% C.I. 26us-728.749us Avg: 76.243us Max: 2060us ReclaimPhase: Sum: 37.207ms 99% C.I. 7us-2322.499us Avg: 54.316us Max: 3826us (Paused)GrayAllNewlyDirtyImmuneObjects: Sum: 23.859ms 99% C.I. 11us-98.917us Avg: 34.830us Max: 128us FreeList: Sum: 20.376ms 99% C.I. 2us-188.875us Avg: 29.573us Max: 998us MarkZygoteLargeObjects: Sum: 18.970ms 99% C.I. 4us-115.749us Avg: 27.693us Max: 122us (Paused)SetFromSpace: Sum: 12.331ms 99% C.I. 3us-94.226us Avg: 18.001us Max: 109us SwapBitmaps: Sum: 11.761ms 99% C.I. 5us-49.968us Avg: 17.169us Max: 67us ResetStack: Sum: 4.317ms 99% C.I. 1us-64.374us Avg: 6.302us Max: 190us UnBindBitmaps: Sum: 3.803ms 99% C.I. 4us-49.822us Avg: 5.551us Max: 70us (Paused)ClearCards: Sum: 3.336ms 99% C.I. 250ns-7000ns Avg: 347ns Max: 7000ns (Paused)FlipCallback: Sum: 3.082ms 99% C.I. 1us-30us Avg: 4.499us Max: 30us Done Dumping histograms young concurrent copying paused: Sum: 229.314ms 99% C.I. 37us-2287.499us Avg: 334.764us Max: 6850us young concurrent copying freed-bytes: Avg: 44MB Max: 50MB Min: 9132KB Freed-bytes histogram: 5120:1,15360:1,20480:6,25600:1,30720:1,35840:9,40960:235,46080:427,51200:4 young concurrent copying total time: 100.823s mean time: 147.187ms young concurrent copying freed: 519927309 objects with total size 30GB young concurrent copying throughput: 5.15683e+06/s / 304MB/s per cpu-time: 333152554/s / 317MB/s Average minor GC reclaim bytes ratio 0.52381 over 685 GC cycles Average minor GC copied live bytes ratio 0.0512109 over 685 minor GCs Cumulative bytes moved 1542000944 Cumulative objects moved 28393168 Peak regions allocated 376 (94MB) / 2048 (512MB) Total time spent in GC: 670.771s Mean GC size throughput: 159MB/s per cpu-time: 177MB/s Mean GC object throughput: 2.94152e+06 objects/s Total number of allocations 1974199562 Total bytes allocated 104GB Total bytes freed 104GB Free memory 10MB Free memory until GC 10MB Free memory until OOME 442MB Total memory 80MB Max memory 512MB Zygote space size 2780KB Total mutator paused time: 544.563ms Total time waiting for GC to complete: 117.494ms Total GC count: 2880 Total GC time: 670.771s Total blocking GC count: 1 Total blocking GC time: 86.373ms Histogram of GC count per 10000 ms: 0:259879,1:2828,2:24,3:1 Histogram of blocking GC count per 10000 ms: 0:262731,1:1 Native bytes total: 30599192 registered: 8947416 Total native bytes at last GC: 30344912
เครื่องมือสำหรับวิเคราะห์ปัญหาความถูกต้องของ GC
ปัจจัยหลายอย่างอาจทำให้เกิดข้อขัดข้องภายใน ART ขัดข้อง การอ่านหรือการเขียนไปยังฟิลด์ออบเจ็กต์อาจบ่งบอกถึงความเสียหายของฮีป หาก GC ขัดข้องเมื่อทำงานอยู่และอาจชี้ว่าฮีปเสียหายได้ด้วย สาเหตุที่พบบ่อยที่สุดของความเสียหายของฮีปคือโค้ดของแอปไม่ถูกต้อง โชคดีที่มีเครื่องมือ แก้ไขข้อบกพร่องของ GC และข้อขัดข้องที่เกี่ยวกับฮีป รวมถึงตัวเลือกการยืนยันฮีปที่ระบุ ด้านบน และ CheckJNI
CheckJNI
CheckJNI คือโหมดที่เพิ่มการตรวจสอบ JNI เพื่อยืนยันลักษณะการทำงานของแอป สิ่งที่ไม่ได้เปิดใช้โดย ตามค่าเริ่มต้น เนื่องจากเหตุผลด้านประสิทธิภาพ การตรวจสอบจะพบข้อผิดพลาด 2-3 อย่างที่อาจทำให้ฮีปเสียหาย เช่น การใช้ข้อมูลอ้างอิงในเครื่องและทั่วโลกที่ไม่ถูกต้อง/ไม่มีอัปเดต วิธีเปิดใช้ CheckJNI
adb shell setprop dalvik.vm.checkjni true
โหมด Forcecopy ของ CheckJNI มีประโยชน์ในการตรวจหา เขียนที่เกินจุดสิ้นสุดของภูมิภาคของอาร์เรย์ เมื่อเปิดใช้ Forcecopy จะทำให้อาร์เรย์ เข้าถึงฟังก์ชัน JNI เพื่อส่งกลับสำเนาที่มีโซนส���แดง สีแดง โซนคือภูมิภาคที่จุดสิ้นสุด/จุดเริ่มต้นของตัวชี้ที่แสดงผลซึ่งมีฟิลด์ ค่าพิเศษ ซึ่งจะได้รับการยืนยันเมื่อมีการเผยแพร่อาร์เรย์ หา��ค่าใน โซนสีแดงไม่ตรงกับที่คาดไว้ บัฟเฟอร์มากเกินไป หรือมีประสิทธิภาพต่ำกว่าเกณฑ์ ซึ่งจะทำให้ CheckJNI ล้มเลิก วิธีเปิดใช้งาน โหมด Forcecopy:
adb shell setprop dalvik.vm.jniopts forcecopy
ตัวอย่างข้อผิดพลาดที่ CheckJNI ควรตรวจจับคือการเขียนหลังจากสิ้นสุด
อาร์เรย์ที่ได้รับจาก GetPrimitiveArrayCritical
การดำเนินการนี้
อาจทำให้ฮีป Java เสียหายได้ หากข้อความเขียนคือ
ภายในพื้นที่โซนสีแดง CheckJNI จากนั้น CheckJNI จะตรวจจับปัญหาเมื่อ
จะเรียก ReleasePrimitiveArrayCritical
ที่ตรงกัน หรือไม่เช่นนั้น
การเขียนทำให้ออบเจ็กต์แบบสุ่มบางอย่างเสียหาย
และอาจทำให้ GC ขัดข้องในอนาคตได้ หากหน่วยความจำที่เสียหาย
เป็นฟิลด์อ้างอิง ดังนั้น GC อาจตรวจจับข้อผิดพลาดแล้วพิมพ์ข้อผิดพลาด พยายาม
ทำเครื่องหมาย <ptr> ไม่อยู่ในพื้นที่ทำงานใด
ข้อผิดพลาดนี้เกิดขึ้นเมื่อ GC พยายามทำเครื่องหมายออบเจ็กต์ที่ไม่สามารถทำเครื่องหมายได้ หาพื้นที่ให้ หลังจากการตรวจสอบนี้ล้มเหลว GC จะข้ามผ่านรูทและจะพยายาม ดูว่าออบเจ็กต์ที่ไม่ถูกต้องเป็นรูทหรือไม่ จากตรงนี้ คุณจะเห็น 2 ตัวเลือก ได้แก่ ออบเจ็กต์เป็นออบเจ็กต์รูทหรือไม่ใช่รูท
ตัวอย่างรูทไม่ถูกต้อง
ในกรณีที่ออบเจ็กต์เป็นรากที่ไม่ถูกต้อง ออบเจ็กต์จะพิมพ์บางส่วน
ข้อมูลที่เป็นประโยชน์ ได้แก่
art E 5955 5955 art/runtime/gc/collector/mark_sweep.cc:383] Tried to mark 0x2
not contained by any spaces
art E 5955 5955 art/runtime/gc/collector/mark_sweep.cc:384] Attempting see if it's a bad root art E 5955 5955 art/runtime/gc/collector/mark_sweep.cc:485] Found invalid root: 0x2 art E 5955 5955 art/runtime/gc/collector/mark_sweep.cc:486] Type=RootJavaFrame thread_id=1 location=Visiting method 'java.lang.Object com.google.gwt.collections.JavaReadableJsArray.get(int)' at dex PC 0x0002 (native PC 0xf19609d9) vreg=1
ในกรณีนี้ vreg=1
ภายใน
com.google.gwt.collections.JavaReadableJsArray.get
คือ
ควรมีการอ้างอิงฮีป แต่มีตัวชี้ที่ไม่ถูกต้อง
ของที่อยู่ 0x2
นี่เป็นรูทที่ไม่ถูกต้อง ��ึง
แก้ไขข้อบกพร่องของปัญหานี้ ใช้ oatdump
ในไฟล์ Oat และรูปลักษณ์
ที่เมธอดที่มีรากที่ไม่ถูกต้อง ในกรณีนี้ ข้อผิดพลาดเปลี่ยนเป็น
เป็นข้อบกพร่องของคอมไพเลอร์ในแบ็กเอนด์ x86 รายการการเปลี่ยนแปลงที่แก้ไขได้มีดังนี้ https://android-review.googlesource.com/#/c/133932/
ตัวอย่างออบเจ็กต์ที่เสียหาย
หากออบเจ็กต์ไม่ใช่รูท เอาต์พุตจะมีลักษณะดังนี้ รูปอัด:
01-15 12:38:00.196 1217 1238 E art : Attempting see if it's a bad root 01-15 12:38:00.196 1217 1238 F art : art/runtime/gc/collector/mark_sweep.cc:381] Can't mark invalid object
เมื่อความเสียหายของฮีปไม่ใช่รูทที่ไม่ถูกต้อง ก็แก้ไขข้อบกพร่องได้ยาก ข้อความแสดงข้อผิดพลาดนี้บ่งบอกว่ามีออบเจ็กต์อย่างน้อย 1 รายการในฮีป ที่ชี้ไปยังออบเจ็กต์ที่ไม่ถูกต้อง