วันจันทร์ที่ 21 มีนาคม พ.ศ. 2565

FIX ASIC 101 : การอัพเดท เฟิมแวร์ ด้วย SD Card (กรณีปกติ)

 FIX ASIC 101 : การอัพเดท เฟิมแวร์ ด้วย SD Card 

สิ่งที่ต้องเตรียม 
1. Micro SD card  ขนาดต้องน้อยกว่า 16Gb เท่านั้น  หากมีความจุมากกว่าจะใช้ไม่ได้ 
2. คอมพิวเตอร์ ที่มี OS ที่สามารถ  Format ด้วย Fat32 (แน่นอนว่า ต้องมีเครื่อง Reader หรือ ตัวแปลงอะไรให้เรียบร้อยด้วย)
3. Download Program Firmware (อาจจะไปที่ Bitmain ก็ได้) หรือ เลือก Custom Firmware ก็ได้ 

ดำเนินการดังนี้
1. ใช้ คอมพิวเตอร์ฟอร์แมท FAT32 (สำคัญมาก ถ้าเป็นแบบอื่นเครื่อง ASIC จะหาไม่เจอ) 
2. ถอดไฟล์บีบอัดไฟล์ มาวางไว้ที่ Folder ที่เป็น root ของ SD Card (ห้ามใส่ไว้ในโฟลเดอร์ย่อยเด็ดขาด) 

ขั้นตอนการ Install
1. ใส่ SD Card บนช่องอ่านของเครื่อง ASIC
2. เปิดเครื่อง แล้วรอเวลา 30 วินาที (เมื่อเสร็จสิ้น ไฟสีแดงและ เขียวจะกระพริบพร้อมกัน)
3. นำการ์ดออก แล้วเปิดเครื่องอีกครั้ง

หากทำไม่สำเร็จ แนะนำดังนี้
1. Format SD Card อีกครั้ง (เพราะเชื่อว่า ไฟล์ในการ์ดอาจไม่ดีแล้ว) แล้วลงโปรแกรม  Firmware รุ่นที่ถูกต้องใหม่อีกครั้ง
2. ทำความสะอาดช่องเสียบ โดยเฉพาะ เศษฝุ่นต่างๆ ให้เรียบร้อยอีกครั้ง แล้วเอาการ์ดไปเสียบอีกครั้งให้แน่น
3. หากยังไม่สำเร็จ ให้ เปลี่ยน SD Card ใหม่ 


วันพฤหัสบดีที่ 17 กุมภาพันธ์ พ.ศ. 2565

Fix ASIC101 : ดูแลรักษา ASIC การลดเสียงและความร้อน

การลดเสียง และอุณหภูมิ
1. เอาตะแกรงพัดลมออก กรณี ขุดในห้องที่ไม่มีแมลง เราแนะนำให้ เอาตะแกงด้านลมเข้า และลมขาออก ออก  แต่ถ้าในห้องที่มีแมลง เรายังแนะนำให้ใส่ตะแกงด้านลมเข้าไว้ก่อน 

ประเด็นนี้ นอกจากลดเสียงแล้ว (จะเป็นเสียงลมฝ่าอากาศที่ถูกแบ่งโดยตะแกรง โดยมันจะเป็นเสียงสูง เหมือนเสียงผิวปาก) มันยังสามารถลดอุณหภูมิลงได้อีกด้วย  ที่สำคัญ คือ อุณหภูมิที่ลดลงย่อมหมายถึง พัดลมทำงานน้อยลง และประหยัดค่าไฟลงอีกด้วย (แม้จะน้อยนิด)

เราแนะนำให้เอาตะแกรงออก ทั้ง PSU และตัว ASIC เลยครับ (ผมทดลองแล้ว ลดลงได้ 1 องศาในทุกการ์ดเลยทีเดียว)

ระดับ Advanced  สุดๆ คือ ในรุุ่นใหญ่ๆ จะมีตะแกรงเหล็กด้านในอีกชั้น ใช่แล้ว เมืองนอก แนะนำ ให้เอาคีมมาตัดมันออกไปเลย มันช่วยได้แน่นอน มีหลายคนบ่นว่า นี่มันตะแกรงโง่ๆ เลยด้วยซ้ำ 

2. การทำความสะอาด ฮีทซิงค์  นอกจากจะสามารถอุณหภูมิลง  ลดรอบพัดลมลง (เสียงลด ค่าไฟลด)  ที่สำคัญคือ มันยังช่วยยืดอายุการใช้งาน ASIC ได้อีกด้วย

มีคนแนะนำว่า ให้ทำความสะอาดทุก 3 เดือน แต่เท่าที่ลอง สำหรับ ประเทศไทยที่ฝุ่นเยอะมาก ทำความสะอาดเดือนละครั้ง ยังสกปรกมากเลย

3. การเปลี่ยนพัดลม ให้รอบลดลง อันนี้ต้องเป็นคนที่รับเรื่องเสียงไม่ได้อย่างมาก เพราะ หาก ไปเอาพัดลมระบายอากาศคอม ประมาณ 3000 รอบ เสียงสามารถลดลงอย่างมาก แต่อุณหภูมิจะเพิ่มขึ้นอย่างมากเลยทีเดียว   หรือ อาจใช้ทางเลือกคือ ตั้งรอบพัดลมให้ลดลง  กรณีนี้เหมาะกับ เครื่องที่ตั้งอยู่ในที่เย็น และทำความสะอาดฮีทซิงค์บ่อยๆ เท่านั้น

บอกเลยว่า กรณีเปลี่ยนพัดลม เคสคอมพิวเตอร์นี้ ลดเสียงลงได้แบบสุดๆ แต่การระบายความร้อนอาจระบายอาจทำได้ไม่ดีมากนครับ แต่เมืองนอกแนะนำให้ใช้ Delta แบบ 2 amp จะดีที่สุด (6000 รอบ) เสียงค่อนข้างเงียบกว่ายี่ห้ออื่น

4. Overclock แล้วลดกระแสไฟลง   นอกจากจะประหยัดค่าไฟแล้ว มันยังช่วยลดอุณหภูมิลงอย่างมาก แน่นอนว่า มันทำให้ เราสามารถลดรอบพัดลมลงได้อีกด้วย 

ผมแนะนำให้คนที่กลัวการเสียค่า Dev หรือที่เราเรียกว่า Custom Firmware นั้น ใช้เถอะครับ ชีวิตดีขึ้นมาก แม้จะเสียค่า Dev 2-3% ก็ตาม

5. เทคนิกการแยกห้องร้อนและห้องเย็น อันนี้เป็นเทคนิคที่ทาง Bitmain แนะนำให้ใช้ เพื่อลดอุณหภูมิห้องลง แน่นอนกว่า มันส่งผลทั้งต่อ รอบพัดลม ค่าไฟ และเสียง 

ทางเลือกนี้ แนวคิดคือ การเอาอากาศร้อนออกจากห้องให้เร็วที่สุด แต่มันเป็นอะไรที่ค่อนข้างแก้ไข และ ทำยาก เพราะต้องวางแผนตั้งแต่แรกเลย

ทางเลือกที่ ผมใช้คือ การใช้ท่อลมอากาศต่อออกหน้าต่าง  เพื่อเอาอากาศร้อนออกจากห้องให้เร็วที่สุด 

6. การลดเสียงสะท้อนตามกำแพงหรือหน้าต่างลง 
อันนี้ดูจะเป็นการลงทุนที่ค่อนข้างเยอะ แต่เราแนะนำว่า สำหรับคนที่ขุดในสถานที่ที่ต้องระมัดระวังเรื่อง เรื่องเสียง เช่น คอนโด หรือ ตึกแถว ที่จะไปรบกวนห้องอื่น

เราแนะนำดังนี้
1. แขวน เสื้อ กางเกง ตามกำแพงให้มาก (มันจะทำลายพลังงานเสียงลงอย่างรวดเร็ว) 
2. ประตูต้องมีน้ำหนัก หรือหนา เพื่อลดเสียงออกจากห้อง 
3. ใช้ตู้ที่มีขนาดหนา มามันช่วยลดพลังงานของเสียง ได้มาก 



วันอังคารที่ 15 กุมภาพันธ์ พ.ศ. 2565

Fix ASIC 101 : ความรู้พื้นฐานเกี่ยวกับ Voltage Domain (แปลจาก ZeusBTC)

ในการซ่อม เครื่องขุด โดยเฉพาะ hash board สิ่งแรกที่เราต้องรู้คือ โครงสร้างของบอร์ด รวมถึง แผงวงจร ชนิดของชิป การจ่ายไฟ และทิศทางสัญญาณ

หัวข้อนี้เราจะมาเจาะเฉพาะ Voltage Domian ของ Hash Board เรารู้แล้วว่า สัญญาณข้อมูล เริ่มต้น ถูกส่งออกชิป U1 ไปถึงชิป ตัวสุดท้าย และจะส่งสัญญาณขากลับ คือ สัญญาณ RI จากชิปสุดท้ายกลับมาที่ ชิปตัวที่ U1 ซึ่งการส่ง/รับ สัญญาณดังกล่าว เป็นทุกแบรนด์เครื่องขุด   

แต่ประเด็นคือ ชิปจำนวนมาก ของ Hash Board มันมีการจ่ายไฟ และ Control ไฟ Voltage เพื่อให้เกิดเสถียรภาพอย่างไร  พวกเขาจัดกลุ่มชิปพวกนี้อย่างไร ถึงสามารถควบคุมได้อย่างอิสระต่อกัน

ถ้า Voltage ระหว่าง Voltage Domain ผิดปกติ  Hashboard ทั้งบอร์ดจะไม่ทำงาน และบ่อยครั้งมันส่งผลอันตรายต่อตัวชิปด้วย 

สิ่งแรกที่เรามักจะเชื่อว่า Hash Board นั้นๆ มีสุขภาพที่ดี ก็คือ Voltage ของแต่ละ Domain ที่ถูกต้อง (ซึ่งจะหมายถึงประสิทธิภาพสูงสุดของบอร์ดด้วย)

ในที่นี้ เราจะอธิบายถึง L3 /T15 / S17 เท่านั้น (เพราะคนแปลมีอยู่เท่านี้ แต่ไม่ต้องห่วง พวกมันใช้หลักการเดียวกันหมด)

1. L3+

L3+ จะมีชิปทั้งหมด 72 ชิป มี 12 Voltage Domain โดยแต่ละโดเมนมี ชิป 6 ตัว (12x6 =72) พวกมันได้รับไฟ 9.6V  นั่นคือ แต่ละ Voltage Domain จะได้รับไฟ 9.6/12 = 0.8 V  นั่นคือ ถ้าเราเอา มัลติมิเตอร์วัดค่อม โดเมนจะต้องได้ไฟ 0.8V และ จิ้มระหว่าง หลังชิป แถวแรกกับแถวสุดท้ายจะต้องได้ 9.6V (ดังรูป)


2. T15 
การ์ด HashBoard มีชิปรวม 72 ชิป แบ่งเป็น 12 Voltage Domain แต่ละโดเมนใช้ 6 ชิปเช่นกัน แต่มันจ่ายไฟถึง 19.8V  ดังนั้น แต่ละ โดเมนจะได้รับไฟ 1.65V (19.8/12 =1.65V)


3. S17
S17 นั้น มีชิปทั้งหมด 48 ชิป และแบ่งเป็น 12 Voltage Domain แต่ละโดเมนมีแค่ 4 ชิป  เมื่อจ่ายไฟเข้า 18.5V แต่ละโดเมนก็จะมีแรงดันไฟ 1.55V (18.5/12=1.54V)


จะเห็นว่า หลักการก็เหมือนกันหมด สำหรับระบบการจ่ายไฟไปแต่ละ Voltage Domain 

บทเรียน พื้นฐานการซ่อม ASIC (ทางทฤษฎี)
Fix ASIC 101 :  บทที่ 1 การตรวจสอบ Kernel Log และ ASIC Status และการซ่อมด้วยตัวเอง 
Fix ASIC 101 :  บทที่ 2 ความรู้พื้นฐานเกี่ยวกับ Domain Voltage
Fix ASIC 101 :  บทที่ 3 วิธีการใช้งาน PICKIT3.5

วันพฤหัสบดีที่ 10 กุมภาพันธ์ พ.ศ. 2565

Fix ASIC 101 : การตรวจสอบ Kernel Log และ ASIC Status และการซ่อมด้วยตัวเอง (รวบรวมมาจาก รัสเซีย)

ASIC Status

1. กรณี  การ์ดทุกใบ ชิปขึ้น xxx ทั้งหมด


1.1 อาจเกิดจากไฟรั่วลงเคส ของตัวขุด หรืออาจ ต่อสายดิน ไว้ไม่ดี 
วิธีทดสอบ  ให้เอามัลติมิเตอร์ไปจิ้มไปที่ ตัวถัง และชั้นวางโลหะ  ถ้ามีแรงดันไฟฟ้ามีมากกว่า 1V ก็แสดงว่า ไฟรั่วลงเคสตัวถัง

1.2 ขั้วสายแลน อาจแตะกับตัวเคส

วิธีทดสอบ ให้เอามัลติมิเตอร์จิ้มไปที่ Lan กับตัวถัง ถ้าแรงดันมากกว่า  1V ก็ใช่เลย ไฟจากแลน รั่วลง เคส 
กรณีนี้ เราแก้ไขด้วยการ ถอดออกมา ประกอบใหม่ให้ดี อย่าให้ Control Board แตะกับตัวถัง(เคส) เพื่อป้องกันไฟรั่วลงเคส

2. กรณี ไม่ขึ้นข้อมูลขุดใดๆ 


2.1 หา HashBoard ไม่เจอทั้งหมด
คำแนะนำ เริ่มต้น คือ ตรวจสอบ สาย IO  เสียบดีหรือไม่ และ Update Firmware ให้เป็นเวอร์ชั่นล่าสุด
(Kernel Log อาจขึ้นเป็น ERROR_SOC_INIT)

2.2  กรอก URL ของ Pool ผิด หรือ ชื่อ User ผิด ASIC จะไม่เริ่มขุด

คำแนะนำ เอา Pool ที่กรอก ลองไป ทดสอบ Ping ในหน้า Network >> Diagnostics และตรวจสอบ User อีกครั้ง

2.3 พัดลมมีปัญหา
คำแนะนำ ก่อนที่เครื่องจะทำการขุด เครื่องจะทดสอบหลายอย่าง หากพบสิ่งผิดปกติ เครื่องจะไม่ทำงาน หนึ่งในนั้นคือ พัดลม หากเสียแค่ตัวเดียว บางรุ่นอาจไม่ทำงานทุกอย่างเลย  ให้เข้าไปตรวจสอบใน Kernel Log อีกครั้ง เพื่อยืนยันว่า พัดลม Error จริงๆ 

2.4 อุณหภูมิสูงเกินไป
คำแนะนำ เครื่องขุด  ASIC รุ่นหลังๆ โปรแกรมจะถูกทดสอบว่า หากบอร์ดมีอุณหภูมิสูงเกินกว่า 85C จะเข้าโหมดป้องกันตัวเอง คือจะหยุดการทำงาน  ต้องเข้าไปตรวจสอบ Kernel Log ขณะที่ ในคู่มือแนะนำให้วางเครื่องขุดในอุณหภูมิห้องไม่ควรเกิน 35C

เราแนะนำให้ ถอด Hash Board ออกมาเป่าฝุ่นบ้าง เพราะฝุ่นทำให้ การระบายความร้อนทำได้ไม่ดีเท่าที่ควร
 
2.5 PSU มีปัญหา
หากตรวจสอบความเรียบร้อยทั้งหมดแล้ว ยังไม่สามารถหาปัญหาได้ เราแนะนำให้ลองหา PSU มาเปลี่ยน ดูก่อน


Kernel Log
เราจะเรียงการตรวจสอบหลักๆ ของเครื่องไล่ไปทีละ Step ดังนี้
1. พัดลม 
ถ้าโปรแกรม ตรวจสอบพัดลมไม่ผ่าน ไม่ว่าจะไม่หมุน หรือ หมุนแต่รอบพัดลมไม่ถึงที่กำหนด  มันจะไม่ยอมตรวจสอบอย่างอื่นต่อ และจะไม่ทำงานใดๆ  ดังนั้น หากเครื่องไม่ทำงาน ให้ตรวจสอบพัดลมก่อนอื่น (เฉพาะรุ่นหลังๆ)

จากรูปจะเห็นว่า แม้ว่า พัดลมหมุน แต่ไม่แรงพอก็ขึ้น error fan lost เช่นกัน



2. CRC_Error
------------------
2021-10-09 20:35:25:driver-btm-api.c:2295:bitmain_basic_init: Fixture data load failed, exit.

2021-10-09 20:35:25:driver-btm-api.c:247:set_miner_status: ERROR_SOC_INIT
--------------------
ERROR_SOC_INIT ความหมายคือ Control Board ไม่ได้เชื่อมต่อกับ Hash Board อย่างเหมาะสม เราจะเริ่มต้นด้วยการเปลี่ยนสายแพร์ (ribbon data cable) ก่อน หรือเสียบสายให้แน่นมากขึ้นก่อนที่จะไปทำอย่างอื่น


3. EEPRom Error
กรณีนี้ ทาง Zeus ระบุว่า เกิดจาก Firmware ของ Control Board มีปัญหา แนะนำให้ Update Firmware ด้วย SD Card เท่านั้น


4. ตจวจ PIC (EEPRom Error)
หลังตรวจพัดลม แล้ว มันจะเริ่มต้นการตรวจสอบ PIC Chip ของ Hash Board แต่ละใบ ว่า ถูกต้องหรือไม่
หากมีเครื่องขุดหลายเครื่อง เราแนะนำให้ซื้อ PIC KIT 3.5 (350 บาท) เก็บไว้ที่เหมืองเลยจะดีกว่า

5. จ่ายไฟถูกต้องหรือไม่

ตัวอย่างจากรูป จะเห็นว่า จ่ายไฟ การ์ดที่ 1 (Chain 0 ) ผิดพลาด S17+ ต้องจ่ายไฟระหว่าง 18-21V

คำแนะนำคือ ให้นำขั้วต่อต่างๆ มาขัด เนื่องจากกระแสไฟฟ้าเดินไม่สะดวก เพราะฝุ่นและสนิม (จากรูปด้านล่าง จะประมาณนั้น)



6. ตรวจเวอร์ชั่นของ CGMiner 
มันจะตรวจสอบ CGMiner  ว่า Version ถูกต้องหรือไม่ เพราะมันจะเป็นโปรแกรมที่ใช้ในการขุด เพื่อให้เป็นไปตามอัลกอริทึ่ม (บางคนจะล้อว่า มันตรวจเพื่อดูว่า จ่ายค่าธรรมเนียมการขุดถูกต้องหรือไม่) ถ้าไม่ถูกต้องให้ ลง Firmware และ PIC Rom ใหม่อีกครั้ง

7. ตรวจ HashBoard แต่ละใบเห็น ชิปกี่ตัว
ถึงตรงนี้ จะขึ้นอยู่กับรุ่นของ HashBoard ถ้าเจอชิปไม่ครบ โอกาสที่ชิปเสียจะเยอะมาก แนะนำให้ส่งให้ช่างซ่อม

กรณีนี้จะแยกเป็น 2 กรณี หลักๆ คือ 1. เห็นชิป 0 ตัว ให้ตรวจระบบไฟก่อน 2. เห็นชิปไม่ครบ ต้องตรวจดูอย่างละเอียดต่อไป

8. CRC Error  ( ซ้ำรึกับข้างนหรือไม่  แต่ครั้งนี้ เขาว่าเป็นการตรวจ ความเสถียรของชิปแต่ละตัว)
ทำได้เพียง ลง Firmware ใหม่ และ เปลี่ยน PSU ไม่เช่นนั้นต้องส่งช่างซ่อม(มีโอกาสที่ต้องยกชิปเปลี่ยนชิปสูง)

 - 8.1 ตรวจ Voltage (เฉพาะบางรุ่น)  เป็นการตรวจ Voltage ของแต่ละโดเมน จุดนี้ จะทำให้เราสามารถสรุปประเด็นได้ดียิ่งขึ้นว่า จุดจ่ายไฟตรงไหนที่จ่ายไฟไม่คงที่อีกด้วย (อาจเป็นที่ LDO ของแต่ละโดเมนไม่ดี)



9. Net Error   (เครือข่ายไม่เสถียร)
ตรวจสอบ เครือข่าย และอินเตอร์เน็ต ว่ายังใช้งานได้ดีหรือไม่

10. Temp error และ Network Error (ปกติมันจะตรวจพร้อมกัน)
กรณี Temp Error จะมี 2 กรณี คือ ชิป Temp Error หรือ อุณหภูมิสูงหรือต่ำเกินไปหรือไม่(แม้ว่าพัดลมจะทำงานแล้วก็ตาม)


ในกรณี ชิป Temp Error มักจะเกิดจาก การ์ดมัน Detect ไม่เจอชิป แต่ความจริงแล้วชิป Temp Sensor มันเสียค่อนข้างยาก แต่ส่วนใหญ่มันเกิดจาก ชิปตัวที่ 1 (U1) หรือชิปตัวสุดท้ายเสีย มากกว่า หรือ Power Supply จ่ายไฟ Under Voltage (ยิ่งต่ำกว่า 230V ยิ่งมีโอกาสเกิดสูง) อีกสาเหตุคือ การสลับ Hash Board ข้ามเครื่อง เพราะ Firmware บางเครื่องไม่สามารถอ่าน Temp Sensor บางรุ่นได้

กรณีนี้ จะเป็นกรณี Temp sensor fail ... ทาง Zeus เชื่อว่า เป็นเพราะจ่ายไฟไม่พอ (ปัจจุบันยังเป็นปริศนาว่า เกิดจากอะไร) แต่คนที่ทำสำเร็จแล้ว จะประมาณนี้
1. ลงเฟิมแวร์ใหม่ (อาจเป็นเพราะมันรองรับชิปก็ได้)
2. เปลี่ยน PSU หรือ ถอดออกมาทำความสะอาด


แต่ถ้าต้องเปลี่ยน  T17 มี 4 ตัว อยู่ใกล้กับชิป 9, ชิป 7, ชิป 22, ชิป 24 
ชิป Temp Sensor จะมี 2 รุ่นคือ NCT218 และ TMP451
NCT218 กินไฟ 1.4-2.75V
TMP451 กินไฟต่ำสุด 1.7V -3.6V

กรณี อุณหภูมิสูงเกินไป
กรณีนี้ แก้ไขด้วยการ ถอดฮีทซิงค์ ที่ใกล้ชิป ตัวที่มีปัญหาแล้วใส่ฮีทซิงค์กลับเข้าไปใหม่


อันหลัง ให้ตรวจสอบ ว่า ใส่ Pool ถูกต้องหรือไม่



ตรวจสอบไฟหน้าเครื่อง

1. ไฟเขียวกระพริบ ไฟแดงดับ       ปกติ
2.                          ไฟแดงกระพริบ    เน็ตถูกตัดการเชื่อมต่อ หรืออุณหภูมิสูงเกินไป 
3.                           ไฟแดงติด      การ์ด hash Board มีปัญหา
4. ไฟเขียวดับ         ไฟแดงดับ      พัดลมไม่ทำงาน


ปัญหาอื่นๆ 
1. เครื่องรีสตาร์ทเอง บ่อยเกินไป
มีต้นเหตุหลายกรณี ตั้งแต่ อินเตอร์เน็ตล่ม ไฟแรงดันตก อุณหภูมิบอร์ดสูงเกินไป รวมถึงไฟรั่ว
2. ระหว่างอัพเกรด เฟิมแวร์ แล้วไฟดับ หรือเผลอไปปิดเครื่อง
ลองลงใหม่ด้วย SD Card ถ้าไม่ผ่านต้องส่ง Control Board ไปซ่อม หรือ ต้องซื้อใหม่ 
3. เปิดเครื่องแล้วไฟที่ Control Boaard ดับทุกดวง
แนะนำให้ ถอดการ์ดออกทุกใบ แล้วเปิดเฉพาะ Control Board ถ้ายังไม่มีไฟติด นั่นคือ มันกลับสู่สวรรค์แล้ว โชคดี 

บทเรียน พื้นฐานการซ่อม ASIC (ทางทฤษฎี)
Fix ASIC 101 :  บทที่ 1 การตรวจสอบ Kernel Log และ ASIC Status และการซ่อมด้วยตัวเอง 
Fix ASIC 101 :  บทที่ 2 ความรู้พื้นฐานเกี่ยวกับ Domain Voltage
Fix ASIC 101 :  บทที่ 3 วิธีการใช้งาน PICKIT3.5












วันพุธที่ 2 กุมภาพันธ์ พ.ศ. 2565

Fix ASIC102 : ซ่อม Antminer L3+

 การซ่อม L3+

อะไหล่ ส่วนใหญ่ จะเป็นแบบ SMD ที่มีขนาด 0402 (มันคือเบอร์ขนาดของอิเลคโทรนิกส์ ซึ่งจะมีขนาดที่เล็กมาก เกือบจะที่สุดแล้ว คือมันมีขนาด 1x0.5 มม. แต่มีเล็กกว่าคือขนาด 0201)  

Control Board
กรณี Control Board เสียนั้น เนื่องจาก รุ่นนี้ใช้ได้ร่วมกับรุ่น A3 และ D3 เพียงแค่ต้องไป Flash Firmware ใหม่ก่อนเท่านั้น  ทำให้เราแนะนำให้ซื้อเครื่อง A3 ในราคาที่เท่าๆ กัน เพราะบางทีราคา Control Board นั้นราคาเกือบเท่ากับราคา A3 มือสอง แต่เราจะได้ทั้ง Control Board Body พัดลม และที่สำคัญ บางทีได้แถม PSU 1600W (ใช้ได้กับ S9 E3) ได้อีกด้วย

Hash Board
ก่อนจะไปเรื่องอื่น ขออธิบายเรื่อง ชิป และ การแบ่งแยกการจ่ายไฟของชิป ก่อนจะไปศึกษาเรื่อง ระบบจ่ายไฟของบอร์ด

Bitmain ออกแบบ Hash Board L3+ โดยใช้ชิป BM1485 จำนวน 72 ชิป โดยทุกๆ ชิปจะต้องมีไฟจ่าย 2 ขา คือ (VDD) 1.8V และ (PLL) 0.9V

Bitmain ได้ออกแบบ โดยแบ่งชุดจ่ายไฟสำหรับชุดชิปออกเป็น Voltate Domain สำหรับ L3+ จะมี 12  Voltage Domain โดยแต่ละ Voltage Domain หรือ แถวจะมี 6 ชิป รวมทั้งหมด มี 72 ชิป  โดยชิปทุกตัวจะต้องได้รับไฟ 2 ขา คือ VDD 1.8V และ PLL 0.9V

ประเด็นนี้ เป็นประเด็นแรก ที่ทำไมเราต้องไล่ระบบไฟ ตั้งแต่ต้นทาง ไปจน LDO(ตัวจ่ายไฟของแต่ละ Domian)  ว่าสามารถจ่ายไฟแบ่งออกเป็น 2 ขา คือ 1.8V และ 0.9V เพื่อไปจ่ายไฟให้ชิปให้ได้นั่นเอง

เราจะแยก การตรวจสอบ ภาพรวมออกเป็น 2 ส่วน คือ ภาคจ่ายไฟ และ ภาคสัญญาณ 

1. ภาคจ่ายไฟ

ภาคจ่ายไฟ ถ้ามีปัญหาตั้งแต่ภาคจ่ายไฟ การ์ดมักจะหาชิปทั้งหมดไม่เจอ หรือ เจอแจ้งว่า ASIC =0

สิ่งแรกที่ต้องทำ ก่อนอื่นเลย คือ ตรวจบอร์ดช๊อต 12V หรือไม่ (ถ้าช๊อต ห้ามเสียบ สาย 6 Pin และห้ามเสียบ Fix Feature เด็ดขาด หรือ PSU เด็ดขาด)

1. เริ่มต้น เราจะตรวจดูด้วยสายตาคร่าวๆ ก่อนว่า มีอะไรเสียหายหรือไม่ เช่น ซิงค์ระบายความร้อนมีการเคลื่อนตัวหรือไม่ ถ้าเคลื่อน มันมีเหตุผลอะไร ชิ้นส่วนต่างๆ อยู่ครบหรือไม่  โดนอะไรกระแทกมารึเปล่า ชิปไหม้มา หรือมีเศษตะกั่วตกหล่นตรงไหนหรือไม่  หากมีความผิดปกติ ด้วยสายตา (Visual)  ถ้าชิปไหนมีปัญหา (หลังเสียบสายทั้งหมด เราจะมุ่งตรวจสอบที่ชิปนั้นก่อนเลยว่า มีไฟ 0.8V หรือไม่ (ด้วยการจิ้มมัลติมิเตอร์จิ้มไป หลังชิป คล่อม โดเมนก่อนเลย) 

2. ถ้ดมา ก่อนดำเนินการอย่างอื่น เราควรตรวจว่า ระบบไฟ 12 V ช๊อตหรือไม่  เน้นว่า  ต้องตรวจช๊อต 12V ก่อนเสียบสาย 12V ก่อนเสมอ (อาการหลัก คือ เสียบ 6 Pin แล้ว เมื่อเครื่องทำงานไปสักพักนึง แต่  PSU (อย่างดี) จะตัดการทำงาน)  ถ้าไม่ตรวจก่อน บอร์ด อาจเกิดความเสียหายหนักได้ (หนักสุดอาจไฟไหม้ หรือ แผงวงจรลายขาด)  หรือ อุปกรณ์ซ่อมแซม ที่มีราคาแพงของเราอาจเสียหาย เช่น PSU หรือ  Fix Feature ที่มีราคาแพง ก็อาจจะพังตามไปด้วยได้

การวัดลัดวงจร หรือเช็คช๊อต  เราจะตั้งค่ามัลติมิเตอร์ไปที่ โอห์ม หรือ ตัวเช็คช๊อต เริ่มต้นที่ ขั้ว 6 Pin (ขาบน (+) กับ ล่าง (-)  อันขวาสุดก่อนเลย)
กรณี วัดโอห์ม  ถ้าได้ค่าน้อยกว่า 4 โอห์ม (แรงต้านทานน้อย) แสดงว่าช๊อต ถ้าวิ่งระหว่าง 1-2โอห์ม นี่เป็นเรื่องปกติ เพราะมันมีไฟค้างในระบบ จาก Capacitor ที่คอยเก็บประจุไฟบางส่วน
กรณี วัดเช็คช๊อต   เมื่อตรวจเช็คช๊อต หากมีเสียงดังแปปนึง ไม่ต้องตกใจ เพราะมีไฟค้างใน Capacitor เช่นกัน แต่ถ้าเช็คแล้ว มีเสียงยาวๆ ก็ไฟ 12V ช๊อตแน่นอน ห้ามเสียบสาย 6 Pin เด็ดขาด)

กรณี พบช๊อตในระบบไฟ 12V ให้ตรวจสอบ 3 จุด ดังนี้ก่อน ไฟฟ้าจะไหลมาดังนี้  >> 
1. (DC Socket) ขั้วสายไฟ 6 Pin >> ตรงนี้ส่วนใหญ่ไม่ช๊อต แต่จะไหม้กันมากกว่า ทำให้ไฟไหลไม่ดี (ควรเปลี่ยนใหม่ เพราะขั้วไหม้ เสมือน มี ตัวต้านทานเพิ่มขึ้นในระบบ)
2. Capacitor  กระป๋อง 3 ตัว >> ก่อนตรวจช๊อต ควรทำการ DisCharge ก่อน ไม่งั้นมัลติมิเตอร์เราอาจเสียหายได้ (ด้วยการเอาแท่งโลหะ มาคั่นระหว่าง 2 ขา สักพักหนึ่ง)  ต่อมาตั้งค่าไปที่ โอห์ม ให้ ดำอยู่บน และ แดงอยู่ล่าง จิ้มทีละตัว ต้องได้ค่าโอห์ม 0.8-1 โอห์ม 
ค่าของมันคือ คือ 1000uF/16V (ตัวนี้ไม่ค่อยช๊อต แต่ก็เช็กซะหน่อย)
3. Capacitor สี่เหลี่ยมด้านบน (ตัวเล็กๆ มีขั้ว  วิธีเช็คไฟ 12V คือ ขาลบจิ้มด้านนอก ตัว Ground แล้วบวกจิ้มที่ ขาด้านขวาของ C ตัวกลางบอร์ด)

ถัดมา ตรวจมาถึงตรงนี้ ก็เสียบสายไฟ 6 Pin ได้แล้ว  โดยเมื่อเสียบสายไฟ 6 Pin ตอนนี้ ควรมีไฟ 12 Volt ไปรอที่ Mosfet ชุดบน (Mosfet จะเปรียบเสมือน สะพานไฟที่รอสัญญาณคำสั่งให้จ่ายไฟออกไป โดยสัญญาณจะสั่งมาจาก Control Board เราจะอธิบายเรื่องนี้ หลังเรื่อง Mosfet อีกที ไม่ต้องตกใจ) 

2. เมื่อเสียบสายไฟ 6 Pin
เมื่อไม่ช็อตแล้ว เราก็เริ่มเสียบสายไฟ 6 Pin จะไม่การจ่ายไฟ 12 Volt จาก PSU มารอ ถึงตรงนี้ ก็เสียบสายสัญญาณ IO ได้เลย ไฟจะเริ่มวิ่งไปทิศทางดังนี้

2.1 Mosfet 3 ตัว (ตัวบน กับตัวล่าง อาจจะคนละรุ่นกัน โดยตัวล่างรหัส MBR540)
ถัดมา ไฟ 12V จะวิ่งไปรอคำสั่งที่ Mosfet ตัวบน 2 ตัว  (Mosfet สีดำ แต่ละตัวมี 8 ขา ไม่ใช่ตัวที่วงไว้นะครับ ตัดดำๆ 3 ตัว) 

Mosfet จะมี 3 ตัว มันออกแบบวงจรตามชิป U73  คือ  2 ตัวด้านบน  (เรียกว่า Hi-Gate เป็นสะพานไฟควบคุมไฟ 12V) และตัวล่าง 1 ตัว (Low-Gate ควบคุมไฟ 10V ถ้าไม่ได้ 10V ให้หา R Feedback มาเปลี่ยน หรือเปลี่ยนยกชุด DC-DC (ชิป และตัวรอบๆ U73)  เพราะวงจรนี้ มันมาจาก U73 (Chip 20 ขา บางคนเรียก IC Drive Gate)  เลย หากใครอยากรู้ละเอียด สามารถไปดู DataSheet (แต่ละรุ่นจะไม่เหมือนกันอีกด้วย) มันจะออกแบบมาสำหรับใช้ Mosfet แบบนี้เลย)   

ลักษณะของ Mosfet คือ ขาบน 4 ขา คือขาเดียวกัน เป็นขาไฟเข้า 12V) และขาล่าง 4 ขา แบ่งเป็น 3 ขาแรกเป็นขาไฟออก  ส่วนอีกขา คือ ขารับ/ส่งสัญญาณ หรือขา en มาจาก enable คือขาที่รับคำส่งให้เปิดปิดสะพานไฟนั่นเอง ) 

ดังนั้น ตัวบน (Hi Gate)  ขาบน ต้องวัดได้ 12V (เทียบกับ Groud ของบอร์ด) และขาล่าง ขณะยังรอคำสั่งเปิดสะพานจะยังไม่มีไฟ และเมื่อมีคำสั่ง en มา Mosfet ตัวล่างถึงมีไฟ และ ขาสัญญาณ en จะต้องมีไฟ 3.2V มาจ่าย ถ้าไม่มี ไฟ 3.2V ที่มาจาก (U73 ชิป 20 ขา ที่มาจากไฟขา 5 มารึเปล่า)

ส่วน ตัวล่าง (Low Gate) เริ่มแรกจะไม่มีไฟมารอเลย (เพราะ Mosfet ตัวบนยังไม่จ่ายไฟลงมา) เมื่อมีคำสั่งเปิดสะพานมาที่ตัวบน( Hi Gate) แล้ว จึงเริ่มจ่ายไฟ ดังนั้น เมื่อวัด 4 ขาบน จะต้องมีไฟ 9.3-10V (วัดไฟตรงนี้ จะขึ้นอยู่กับการ OC บนเฟิมแวร์ด้วย เช่น เฟิมแวร์ไปลดไฟมา อย่างไรก็ดี ถ้าห่างจาก 10V เยอะ แสดงว่า R Feedback มีโอกาสยืดค่า หากยืดค่า หรือค่าความต้านทานกระแสจะเพิ่มขึ้น จะทำให้กระแสไฟเดินได้น้อยลง นั่นเป็นเหตุให้ HW error สูง ตัวนี้ช่างส่วนใหญ่ ที่ซ่อมจะมองข้ามตัวนี้ไป ทำให้ขุดได้ แต่ HW สูง)

วิธีเช็คช๊อต Mosfet ด้วยการจิ้ม 4 ขาบน กับ  Ground  ถ้าช๊อต ก็คือ Mosfet ช๊อต หรือ เช็คขา 4 กับขา 5 (บนกับล่าง) ต้องวัดได้ 4 โอห์ม รวมถึงเช็คช๊อต ขา 4 กับขา 8 (en) ด้วย 

ระบบ DC-DC
คราวนี้ เราจะพักเรื่องไฟจาก Mosfet ย้อนกลับไปดู การเปิดสัญญาณ en ให้กับ Mosfet เพื่อเปิดสะพานไฟ 

2.1 เริ่มต้น สัญญาณจะถูกส่งมาจาก Control Board ส่งมาที่สาย IO มาเข้าพอร์ต IO แล้วส่งมาเข้าที่ PIC Chip (ชิปตัวยาวๆ ที่มี 14 ขา ความจริงแล้ว ตัวนี้คือ มันสมอง ของบอร์ดเลย เพราะมันคอยสั่งงานออกไป และรับ/ส่ง สัญญาณต่างๆ อีกด้วย) โดย  Pic Chip จะต้องมีไฟมาจ่ายที่ขา 1 (ขาบนซ้ายสุด 3.2V วัดเทียบกับ Ground ของบอร์ด หรือ Group ของ PIC Chip เองก็ได้ Groud จะอยู่ด้านล่าง ซ้ายสุด ) 

2.2 PIC Chip  (ชิปที่มีทั้งหมด 14 ขา) ตัวนี้จะมีหน้าที่รับคำสั่งจาก IO Port (รับจาก Control Board) โดยจะมีหน้าที่หลัก 2 อย่าง

1. เป็นตัวสั่งการทำงานของระบบไฟของการ์ด ให้ทำงาน 
หาก ยังไม่มีคำสั่งให้ทำงาน PIC Chip ขา 4 ด้านล่างนับจากซ้าย จะต้องวัดไฟได้ 3.2V และ Transitor (ชิป 3 ขาด้านซ้ายของ PIC Chip) ขาด้านล่างจะต้องวัดไฟได้ 0V แต่เมื่อมี คำสั่งจาก PIC Chip มาแล้ว ขา 4 จะต้องวัดไฟได้ 0 V และ ขา Transitor 3 ขาล่างจะต้องวัดไฟได้ 3,2V แทน (สลับกัน)

ถ้าวัดได้ค่าดังกล่าวถูกต้อง แสดงว่า PIC CHIP ทำงานได้ถูกต้อง (แต่ถ้า Pic Chip ทำงานไม่ถูกต้อง  เราต้องลง Rom ใหม่ หรือ EEPROM  ด้วยเครื่องมือ PICKit 3.5 
(ถึงตรงนี้ ความจริงแล้ว ช่างควร อ่านได้จาก Kernel Log  ตั้งแต่แรกแล้ว เพราะมันจะฟ้องว่า ERROR EEPROM  ดังนั้น ถ้าตรงนี้เสีย ช่างควรรู้ก่อนแกะบอร์ดออกมาด้วยซ้ำ ถ้ามาซ่อมตรงนี้ ถือว่า ช่างไม่ตรวจงานให้เรียบร้อยก่อนซ่อม อย่างไรก็ดี ช่างมือใหม่อาจหลงมาถึงตรงนี้ได้)

2 มันยังทำหน้าที่ รับส่งสัญญาณ (เหมือนการเต้นของหัวใจ) โดยเฉพาะ
ขา 5,6,7  (ด้านล่างนับไป) เป็นขารับ Address 
ขา 8 (ขาบน ขวาสุด)เป็นการรับค่า FB จาก IO Port (ผ่าน R107 ค่า49.9K)
ขา 9,10 (ขาบน รองขวาสุด) เป็นการับค่าจาก IO Port I2C 

ชิป IC Drive Gate หรือ U73


จะมี 3 รุ่นคือ LM27402SQ (16ขา ด้านละ 4 ขา เป็นรุ่นที่ต่ำกว่า Version 1.5 จะใช้รุ่นนี้ ) และ LTC3807EUDC (20ขา ซ้ายขวา 6 บนล่าง4) ชิปอีกตัวคือรุ่น 1.6 (UP9305W )


กรณี ไฟ DC-DC ผิดปกติ ต้องกลับไปตรวจสอบ PIC Chip ว่า ส่งมาค่าเดียวกับ DC-DC รึเปล่า ถ้าไม่ ต้องเปลี่ยนค่า Capacitor รอบๆ LM27402SQ ก่อน

แต่ถ้า DC-DC ไม่มีไฟออกมาเลย ต้องตรวจไฟขา en ที่ผ่าน R13 (91K), R14(12K) (เป็นตัวแบ่งไฟ 12V) ก่อนว่ามีไฟ 1V หรือไม่ ขณะที่ R11 (ไฟจาก 12V ผ่าน Mosfet แล้วผ่าน R11 ไปรอเข้า IC Drive)  ต้องได้ไฟ 12V (ขา 7 VIN) ถ้าไฟมาปกติ ต้องย้อนกลับไปตรวจ PIC Chip อีกครั้ง

และก่อนส่งสัญญาณ จ่ายไฟถึง Mosfet ที่จะไปจ่ายไฟ 10V  หรือไม่  ถ้าไม่ได้ค่า 10V ให้กลับมาตรวจ ค่า R (รอบๆ 3 ตัว) ถ้า R ยืด อาจวัดค่า ที่ Mosfet ได้ไม่ถึง 10V

ขาตัว LM27402SQ (นับขา 1 จากบนซ้ายสุดวนทวนเข็มนาฬิกาไป)
ถ้ากลัวงงให้ข้าม DataSheet ของ IC Drive  ไปก่อนได้ 
ก่อนอื่นจำไว้ว่า ถ้าอ่านวงจรไหน ว่า เจอ Mosfet 4 ตัวกับชิปตัวนี้มักจะเป็นการ ลดแรงดันลง เพื่อเพิ่มกระแส

ด้านซ้าย
ขา 1 เป็นขา Stack 
ขา 2 นับจากบน เป็นขา FB หรือ Feedback แรงดันว่าได้ไฟ 10V หรือไม่
ขา 3 นับเรียงลงมา เป็นขา COMP หรือ Compare คือ รับค่าจาก ขา 2 กลับมาเปรียบเทียบค่านั่นเอง มันจะส่งค่าทั้ง 2 ไป PIC Chip เพื่อปรับค่า
ขา 4  จะคู่กับ ขา 1 เสมอ เป็นขา FADJ  มันจะต่อคู่กับ ขา 1 โดยผ่าน C74 47nF และ R16 91K เพื่อปรับค่าความถี่ของไฟ (ให้อยู่ระหว่าง 200 kHz  ถึง 1.2 MHz) มันทำงานร่วมกับ Cboost ถ้าไฟไม่มา 10 V .ให้กลับมาตรวจขา 4 กับขา 1 ได้เลย

ด้านล่าง
ขา 5 ขาล่างซ้ายสุด ขา En หรือ ขา Enable (รับค่าจาก R13 และ R14)
ขา 6 เป็นขา Sync ค่าความถี่ภายนอกให้ได้ค่าที่ได้จากขา 4 (แต่ต่อภายนอกไปยัง Groud)
ขา 7 ขาที่ 3  คือขา VIN  (ตาม DataSheet ระบุ รับค่าได้ตั้งแต่ 3-20V) ขานี้ คือ ไฟ 12V จะผ่าน 3 Cap แล้วผ่าน Mosfet และผ่าน R11 ก่อนเข้ามาที่ขานี้
ขา 8  ขาสุดท้าย ขา PGOOD จะทำงานคู่กับ ขา 10 และ 13

ด้านขวา
ขา 12 ขาบนสุด เป็น SW มันมาจาก Diode ต่อเข้า C1 แล้วเข้ามา SW  (หน้าที่ของมันคล้ายๆ กับ Inductor คือยุบ ขยาย ๆๆ เหมือนวงจร Booster) แต่มันกลับกันคือ ลดแรงดัน Boost กระแส (ตัวนี้ทำงานรึเปล่าต้องเอา Scope ดูคลื่นว่ามีหรือไม่ (ก่อนที่จะกล่าวหาว่า Chip ตัวนี้เสีย ต้องไปดู Diode ก่อนเข้าขานี้ก่อน)

จ่ายไฟไป Mosfet 10V  เป็น Switch High side Grade
ขา 11 ขารองมา เป็น LG  หรือ Low Side Mosfet Gate (เกี่ยวกับ Mosfet ตัวล่าง 10V) 
ขา 10 ขารองมา เป็น VDD (ขานี้จะสัมพันธ์กับขา 13 เพราะ เมื่อไฟผ่าน C1(Cap100nF ) ส่วนหนึ่งไปขา 13 แล้ว จะจะมีการต่อไฟแล้วผ่าน D5(Diode ชิปสีดำ 2 ขั้วตัวใหญ่กว่าตัวอื่น) เข้าขานี้
ขา 9  ขา Groud

ด้านบน 
ขาที่ 16 ขา CS+
ขาที่ 15 ขา CS- 
ขา 15 - 16 ทำงานคู่กับ ขา 11 (LG) และ ขา 12 SW  2 ขานี้เป็นตัวตรวจสอบกระแส 10V
ขาที่ 14 ขาที่ 3 นับจากซ้าย)  เป็น HG เป็น High Side Mosfet gate (เกี่ยวกับ Mosfet ตัวบน 12V)
ขาที่ 13 (ขาขวาสุด) ขา CBoot เป็นขาที่รับไฟผ่าน C1 (Capacitor 100nF ตัวนี้ DataSheet บอกต้องผ่าน C ค่านี้ก่อนเสมอ)

ขา สำหรับ LTC3807EUDC
ขา 5 Sense - (Shorted ชุด 10V) เป็นขาเข้าเพื่อ วัดกระแส ระหว่าง IntVCC-0.5V เพื่อจ่ายกระแสไฟออก ขา 7 (ล่างซ้ายสุด) VFB  เป็นค่า Feed back
ขา 9  คือขา FGood
ขา 11 SW(Shorted ชุด 10V) เชื่อมต่อไปยัง inductor (ขดลวด)
ขา 14 (ขาที่ 3 ด้านขวา) มันจะต่อมาจาก LDO  โดยมันต้องมี Capacitor ขนาด 2.2uF ขึ้นไปรองรับ
ขา 15 ExtVCC (Shorted ชุด 10V) ไฟจากภายนอก 
ขา16 (ขวานสุด) PGND (ขานี้จะไปหา N Channel ของ Mosfet)
ขา17 (บนขวาสุด)  VIN ไฟเข้า
ขา 18 (บนถัดมาทางซ้าย) LIN (สัญญาณเข้า 0.3V)


3.  ระบบไฟ หลัง Mosfet
ย้อนกลับมาเรื่องระบบไฟ หลังจาก Mosfet 10V (ตัวล่าง) จ่ายไฟออกมาได้แล้ว  มันจะจ่ายไฟ 10V  ไปยัง L ขดลวด ก่อนส่งไฟส่วนหนึ่งไปยัง Domain ด้านล่าง (ชิปด้านล่าง) 12 โดเมน  และอีกส่วนจ่ายไฟไปที่ ชุด Booster (ด้านซ้ายมือของบอร์ด ตามรูปด้านบน)  เพื่อรอจ่ายไฟให้อีก 2 Domain สุดท้ายด้วย 

ถึงตรงนี้ เราควรตรวจไฟ แต่ละ Domain โดยจิ้มหลังชิป ค่อมหลัง โดเมน จะต้องได้ 0.8V และรวมต้องได้ 9.3-10V (ตามรูปด้านล่าง)

 


3.1 เมื่อ Mosfet ปล่อยไฟเข้า ขดลวด ก็จะจ่ายไฟไป Capacitor กลางด้านซ้าย (22uf/25V) และ 100uf/16V  2 ตัว (ต่อขนานกันกับ Groud) เหลือแรงดันแค่ 10V (จิ้มวัดไฟให้ถูก) ถ้าไฟไม่มา ให้ย้อนกลับไปตรวจไฟก่อนหน้านี้ก่อน

3.2 ถ้าไฟผ่านมาที่ Capacitor กลางซ้าย  ต้องได้ 10.0V (ตัวนี้ ถ้าไฟไม่มา ให้ย้อนกลับไปเช็ค Mosfet ตัวดำๆ  3 ตัว) โดยมันจะส่งไฟไปรอยังชุด Booster อีกทีที่แรงดันไฟ 10V

ก่อนจะไปเรื่องหลังจากนี้  เราต้องเข้าใจ ระบบการจ่ายไฟ ด้านล่างก่อนว่า  ....... LDO ด้านล่างคือ ชุดจ่ายไฟให้ชิปแต่ละ Domain (รูปด้านบน จะเป็นชิปสีดำ ตัวเลขทับอยู่) โดยระบบจ่ายไฟจะแยก เป็น 2 ชุด คือ ชุดแรก คือ โดเมน 1-10  และ โดเมน 11-12 (ในอนาคตเราจะเรียกว่า 2 โดเมนสุดท้าย)

4 ชุด Booster สำหรับจ่ายไฟให้ LDO 2 Domain สุดท้าย
อยู่ด้านซ้ายสุดของบอร์ด  มันมีหน้าที่ แปลงให้ไฟ 10V ไปกลายเป็นไฟ 14V เพื่อจ่ายไฟไป LDO เฉพาะ 2 Domian สุดท้าย ดังนั้น วัดไฟขาออกจาก Boosetr จะต้องได้ 14.0V (ตัวนี้ถ้าวัด ไม่ออกเลย หรือได้ 10V หรือ 12V ให้เปลี่ยนชุด ใหม่ Booster จบเลย แต่ถ้าไฟเกิน 14V ให้เปลี่ยน R และต้องลงไปเช็ค LDO ด้านล่างด้วยว่าช็อตหรือไม่ อาการนี้จะเจอชิปครบ แต่จะเกิด HW เยอะ ช่างมักมองข้ามเช่นกัน)
(ถ้า Booster ชุดเดิมของบอร์ด  ส่วนใหญ่จะเสียที่ออกซิเดชั่น(สนิม) ในตัวชิป U111(เป็น Power Supply Switch ของชุด Booster เลย) และตัวต้านทาน 2 ตัวข้างๆ มัน คือ R996(10K) R997(698K) 2 ตัวหลังเป็นตัวเช็คไฟว่าได้ 14V หรือไม่ ถ้าไม่ใช่ มันจะเอาไฟจาก Capacitor มาจ่ายไปให้ L1 เพื่อให้ไฟเป็น 14V นั่นเอง (ตัวชิป U111 ที่เสียบ่อย เพราะมันเป็นตัวสับสวิทซ์ซ้ำๆ ถ้าใช่ 14V จะให้ Capacitor ชาร์จไฟ ถ้าไม่ใช่ 14V ให้ Capacitor จ่ายไฟให้เป็น 14V เรียกว่า มันสับสวิทช์บ่อยจนเจ๊งนั่นเอง)

ส่วนการเปลี่ยน Booster ทั้งชุด Kit นั้นมีข้อดีกว่า คือ มันทนกว่า โดยเฉพาะชิป ดั้งเดิม U111 นั้นไม่ค่อยได้คุณภาพ 


3. LDO
มาถึงจุดนี้ Booster สามารถจ่ายไฟ 14V ออกมาได้แล้ว แต่มันจ่ายเฉพาะ 2 โดเมนสุดท้าย (2แถวขวาสุด)  และ Mosfet ชุดกลาง(10V แยกจ่าย 12 โดเมน) ลงมาที่ชุด  LDO ทั้ง 12 ตัว  แต่เราต้องเข้าใจการจ่ายไฟก่อน

ระบบการจ่ายไฟ เข้า LDO แต่ละ Domain  จะเป็นดังนี้
แรงดันไฟ 10V จะถูกแบ่งจ่ายออกมาแต่ละ 12 Domain  (แรงดันไฟฟ้าจึงถูกหารด้วย 12 Domain 10V/12 = 0.83 Volt วัดโดยการการจิ้ม บวกลบ หลังชิป ข้ามโดเมนเท่านั้น ถ้าได้ต่ำกว่านี้แสดงว่า มีการตั้งค่า V ให้ต่ำกว่า เช่น 9.32/12 = 0.776V ต่อโดเมน) 

สรุปให้เข้าใจง่ายๆ คือ ชุดไฟ DC-DC จะจ่ายไฟแต่ละโดเมนคือ 0.83V ขณะที่ชุด Booster จะจ่ายไฟเพิ่มไปที่ 2 Domain สุดท้ายเพิ่ม  

LDO (Low-dropout regulator (LDO regulator) ) มันเป็น FET ชนิดหนึ่ง แต่ มันสามารถปรับสัดส่วนแรงดันไฟขาออกให้นิ่งได้ระดับหนึ่ง โดยสเปคของบอร์ดนี้  LDO รุ่นนี้ จะรับแรงดันไฟเข้าระหว่าง 2-6V (ไฟเข้าที่ ขา1 และขา 3  และจ่ายไฟออกที่ขา 5 1.8V) ดังนั้น ถ้ามีไฟจ่ายมาเกิน 6V มันจะช๊อตเสียได้ (ถอดเปลี่ยน)  

มันมี 5 ขา นับจาก ล่างวนทวนเข็มนาฬิกา ดังนี้
ขา 1 กับขา 3 ไฟเข้า LDO จะทำงานก็ต่อเมื่อ ไฟอยู่ระหว่าง  2-6 V ถ้าไฟจ่ายมาเกินจะเสียด้วย วิธีวัดคือ วัดกับ หลังชิป หรือ Groud บอร์ดเลยก็ได้
ขา 2  ขา Ground หรือขั้วลบ 
ขา 4  คือ ไม่ได้ใช้งาน 
ขา 5  ขาไฟออก จ่ายให้แต่ละ ชิป โดยทุกตัว (1-12) จะจ่ายไฟออกที่ 1.8V (วัดกับ Ground หลังชิป)

คำอธิบายเรื่อง Booster  กับ 2 Domain สุดท้าย **  LDO ไม่ควรใช้สลับกันเด็ดขาด **
มาถึงตรงนี้ ต้องอธิบายเรื่อง แรงดันไฟขาเข้า LDO ต้องอยู่ระหว่าง 2-6V

นั่นคือ LDO แต่ละตัว จะรับ แรงดันไฟจาก 3 Domain มาจ่ายไฟนั่นเอง 0.83x3 = 2.5 V จะเป็นไฟขาเข้าของ LDO  ยกตัวอย่าง เช่น LDO ของโดเมนที่ 1 จะรับแรงดันไฟจาก โดเมนที่ 1, 2, 3 มารวมกันเป็น 2.5 V นั่นเอง ไล่ไปเรื่อยๆ เช่น LDO ของ โดเมนที่ 5 จะรับแรงดันไฟจาก โดเมน 5,6,7 = 2.5V

โดเมนที่ 10 ก็ยังคงรับไฟมาจากโดเมนที่ 10 ,11 ,12 ก็ยังสามารถจ่ายไฟให้ LDO ได้ 2.5V เช่นกัน


แต่ประเด็นคือ  แล้ว โดเมนที่ 11 กับโดเมนที่ 12 ละ ?? นี่เป็นประเด็นว่า ทำไม 2 Domain สุดท้ายต้องมีชุดจ่ายไฟ Booster จ่ายไฟเพิ่มให้ (ประมาณ 3V) ขณะที่ LDO ของ Domain 11 นั้นรับแรงดันไฟจาก ตัวเอง  และโดเมนที่ 12  และ Booster จึงได้รับไฟเท่ากับ 5.5V (3V (Booster) + 11(0.8V)+12(0.8V)  ขณะที่ LDO ตัวสุดท้าย จะรับแรงดันไฟได้  3.5-4V (3V Booster) +12(0.8V)

ทำไม ไม่ควรเอา LDO มาสลับใช้
แต่กรณีของ LDO 2 โดเมนสุดท้าย (ตัว LDO มันคนละเบอร์กับ LDO โดเมน 1-10 แม้ตามสเปค มันจะรองรับไฟได้ 2-6V นั่นคือ ควรจะสลับกันได้ แต่มันต้องมีเหตุผลบางอย่างที่ไม่ควรสลับกัน)  

อีกประเด็นคือ  .... ถ้าวัดไฟ ขาออกของ Booster แล้วได้เกิน 14V มีโอกาสสูงที่ LDO 2 ตัวล่างจะเสียไปด้วย ดังนั้น ก่อนเปลี่ยน Booster อย่าลืม เช็คไฟขาเข้า LDO 11 กับ 12 ด้วย รวมถึงเช็คด้วยว่า ช๊อตหรือไม่ (ช่างบางคน ก่อนเปลี่ยน Booster จะใช้สายโยง(คือโยง 12V มาจ่ายไฟแทน Booster)  เพื่อตรวจดูว่า LDO 2 ตัวนั้นเสียด้วยหรือไม่  ไม่งั้น มันจะเสียล่าง เสียบน เปลี่ยนไม่จบไม่สิ้น )

เช็คช๊อต ของ LDO คือ ต้องวัด Diode ขา 5 กับ ground ต้องได้ 40 โอห์ม ** ต้องเช็คก่อนเปลี่ยนเสมอ** นอกจากนี้บางที C ข้างๆ มันก็อาจช๊อต ไปด้วยก็ได้

R แบ่งกระแส
ตัวสุดท้ายที่เราจะเรียนรู้คือ ชุด R ที่ใช้แบ่งกระแสไฟออก  อย่างที่เราบอกข้างต้น  ว่าชิปทุกตัวต้องมีไฟจ่ายเข้าชิป 2 ชุด คือ 1.8V และ 0.9V

ตอนนี้เราได้ แรงดันไฟ1.8V จาก LDO มาแล้ว 12 โดเมน แยกไปจ่ายแต่ละชิป ..........  แต่ ไฟ 0.9V มาจากไหน?? นั่นคือ เราใช้ R แบ่งกระแสไฟ ออกเป็น 1.8V และ 0.9V อธิบายดังนี้

ถ้าไฟจ่ายจาก LDO ถูกต้องแล้ว คือ ไฟขาออกต้องได้ 1.8V ทุกตัว  แรงดันไฟมันจะถูกแยกด้วยค่า R 2 ตัว R824 ตัวใน (33) กับ R825 ตัวนอก (39) (ชิปสีดำ) ข้างๆ Cap 2 ตัว ( C มีหน้าที่แค่ทำให้ไฟมันนิ่งเท่านั้น) เพื่อแยกไปจ่ายไฟ 0.9V อีก 1 ตัว

โดยชุด R ตรงนี้ถือเป็น ชุดแบ่งชุดไฟ ให้ออกมาเป็น 1.8V กับ 0.9V 

ก่อนจะไปภาค สัญญาณ เรามาเน้นกันอีกครั้งว่า  
R หรือ Resistor  ตัวต้านทาน ชิปสีดำ มันจะมีแต่ ขาดเท่านั้น ไม่มีการช๊อต เด็ดขาด
C หรือ Capacitor ตัวเก็บประจุ  ชิปที่คาดสีเหลืองหรือน้ำตาล  มันจะมีทั้งขาด และช๊อต 

ประเด็นนี้ถือว่า สำคัญมากในการวิเคราะห์ถัดไป

สังเกตจุดแรกคือ ตัว R ยังอยู่ครบมั้ย  เพราะ R จะเป็นตัวแยกไฟจาก LDO เป็น 2 เส้น จ่ายเข้า ชิปแต่ละตัว 2 ทาง (เรียกวงจรนี้ว่า Voltage Spliter ) 
วัดค่า R ตัวแรก ต้องได้ 33 โอหม์ ตัวที่ 2 ต้องได้ 39 โอห์ม ไฟที่ถูกแบ่งออกจา R 2 ตัวนี้คือ 1.8 และ 0.9 จะเรียกว่า PLL (ถ้าไม่ใช่ จะทำให้สัญญาณ CLK เพี้ยนได้)

ถ้าไฟมาถึงตรงนี้แล้ว ถือว่า จบภาคจ่ายไฟ เข้าชิป แล้ว  ที่เหลือเป็นภาคสัญญาณ

อีกประเด็นคือ เมื่อจิ้มไฟหลังบอร์ด (ขณะขุด) คล่อม Domian แล้วจะต้องได้ค่า 0.83V และแต่ละโดเมนห้ามต่างกันเกิน 0.05V (ตรงนี้ พอจะบอกได้ว่า ตัวชิปไม่ได้เสีย แต่ส่วนใหญ่จะเกิดการลัดวงจร ให้ลองถอดซิงค์ออกมาดูอีกครั้ง โดยเฉพาะค่า C และ R ที่มีโอกาสเสื่อมมากกว่า)

ภาคสัญญาณ 
ย้อนกลับมาที่ ภาคสัญญาณ จะเริ่มต้นด้วย สายสัญญาณ จะวิ่งมาที่  IO Port แล้ววิ่งไปเข้า PIC Chip  (เราจะข้ามเรื่องที่มันไปสั่งจ่ายไฟที่ Mosfet ภาคจ่ายไฟ) เพื่อจ่ายสัญญาณ CO RI/RX (รับค่า) BO RST  4 ตัวนี้ ถ้าไม่มีสัญญาณ แสดงว่า PIC Chip มีปัญหา ต้องลงโปรแกรม PIC Chip ใหม่

สัญญาณจะมีทั้งหมด 5 ตัว ดังนี้  CLK  CO  RI/RX   BO  และ RST  

สัญญาณ ของ Bitmain จะมี CLK CO RI BO RST
1.  CLK หรือ Clock สัญญาณนาฬิกา มันเปรียบเสมือน ตัวหลักในการนำส่งสัญญาณอื่นๆ ไปกับตัวมัน (เหมือนรถยนต์บรรทุกสัญญาณอื่นไปกับมัน)  สัญญาณ CLK จะเริ่มต้นสัญญาณนาฬิกาที่ Oslli 25Mhz ที่ ข้างๆ ชิปหมายเลข 1 (ล่างขวาสุด) หรือ ในแผงวงจรจะเป็นตัว Y1 (วิ่งจากชิปตัวที่ 1 ไปหาตัวที่ 36 บางตำราว่าวิ่งไปถึงตัวสุดท้ายเลย ) ขณะที่ ข้างๆชิปตัวที่ 37 คือ  Y2 จะส่งสัญญาณ Clock จากตัวที่ 37 ไปหาตัวที่ 72

โดยเมื่อยังไม่ได้ทำงาน (และยังไม่เสียบสายสัญญาณ CLK จะวัดได้ 0V และถ้าเราเสียบสาย เราวัดไฟได้ที่ 1.8V แต่เมื่อเริ่มต้น ขุด เราจะวัดไฟได้ที่ 0.9V ตลอดเส้นทาง ยกเว้นชิปตัวที่ 36 เพราะชิปตัวที่ 37 จะถูกปล่อยจาก Oslli ตัวที่ 2 

ประเด็นของ สัญญาณ CLK 
ดังนั้น ตอนนี้เรารู้แล้วว่า ถ้าสัญญาณ CLK จะถูกแบ่งเป็น 2 ส่วน ถ้าเสียยกส่วน เช่น 37-72 นั่นคือ OSilli ตัวที่ 2 เสียนั่นเอง

แต่ถ้าเสีย แบบยกโดเมน เราต้องเข้าใจว่า สัญญาณ CLK จะเดินทางข้ามแต่ละ โดเมนได้ มันจะต้องผ่าน C (ตัวนี้เสียบ่อย ค่าคือ 100 nanofarud)  และ R อีกหนึ่งตัว (อยู่ด้านล่างสุดของแต่ละโดเมน) ดังนั้น ถ้า โดเมนไหน วัดได้ 1.7V สลับ 0 V ไม่ใช่ 0.9 V ให้ลงไปดูตัว C ด้านชิป (ติดซิงค์) ด้านล่างได้เลย มีปัญหาแน่นอน 

2. CO/TX  คือ สัญญาณเข้า  (หลักการการติดต่อสื่อสารคือ TX tranmision จะส่งสัญญาณไป RX แล้ว RX ต้องส่งกลับ) เพื่อสื่อสารถึงกันหมด (เพื่อให้ Hash Board คุยกับ Control Board คุยกันรู้เรื่องนั่้นเอง) มันรับสัญญาณมาจาก ขาที่ 11 ของ IO Port  โดยมันจะวิ่งไปเริ่มต้นที่ชิปตัวที่ 1 ไปหา ชิปตัวที่ 72 เลย  โดยมี แรงดันไฟ 1.8 V ตลอดเส้นทาง

3. RI/RX มันคือ ทางสัญญาณกลับของ CO/TX นั่นเอง โดยมันจะวิ่งจาก ชิปตัวที่ 72 กลับไปหาตัวที่ 1 และกลับไปขาที่ 12 ของ IO Port  ไม่ว่าจะมีสัญญาณหรือไม่มีสัญญาณ เราจะต้องวัดได้ 1.8V เท่ากับสัญญาณขาเข้า (ประเด็นการวัดค่า คือ ต้องวัดค่อม ชิป และสัญญาณ คือ วัดสัญญาณของตัวที่ 54 ต้องจิ้มสัญญาณตัวที่ 53 และจิ้มหลังชิปที่ตัวที่ 54 จะมีตัวเดียวที่ต่างจากสัญญาณอื่น)  ถ้าตัวไหนน้อยกว่า แสดงว่าไฟอาจมาไม่พอ

4 BO
  เป็นแรงดันไฟอ่อนๆ  (Low Voltage ) วิ่งจาก ชิปตัวที่ 1 ไปตัวที่ 72 โดยต้องวัดค่าได้ 0.-0.03V  

5 RST หรือ สัญญาณ Reset  จะเริ่มต้นจาก IO Port ขาที่ 15  วิ่งจากชิปตัวที่ 1 ไปชิปตัวที่ 72 ไฟ 1.8 V 

เมื่อเราเข้าใจระบบสัญญาณ เราจะเข้าใจว่า ชิปตัวไหนที่เสียแล้ว  แล้วเราจะวัดชิปว่าชิปไหนเสีย ได้อย่างไร เราวัด 2 อย่าง คือ ค่า Voltage (วัดตามค่าข้างบน) กับ ค่าไดโอด (มันมี ไอโอดอยู่ภายในชิปเลย ไดโอดคือ ให้ไฟไหลได้ทางเดียว มีขาแอโนด กับคาโทด มีค่าการวัดเป็น Impedence ) ต้องวัดค่า ไอโอด ได้ที่ 420-480 (ทุกสัญญาณ ทุกตัว)

เรียงดังนี้
RST , BO , RI/RX , CO, CLK
1.8   , 0    , 1.8      ,1.8  , 0.9V(ยกเว้น ตัวที่ 36 จะวัด Diode ได้ 0) 
                , 72-1,          ,1-72


ตัวอย่าง การค้นหาชิป เสีย
เมื่อวัด CLK ได้ 0.9V แต่พอวัดชิปตัวที่ 18 กลับวัดได้ 1.8V แสดงว่า หลังตัวที่ 18 จะวัดได้ที่ 1.8V ทุกตัว นั่นคือ ตัวที่ 18 หรือ 19 คือตัวที่เสีย

ย้อนกลับมาที่ RO ถ้าตัวที่ 18 ไม่มีสัญญาณ ก็แสดงว่า ตัวที่ 18 หรือ 19 เสีย ดังนั้น 2 สัญญาณนี้จะบอกได้ว่า ชิปไหนเสีย

ชิป 
ชิปมันจะต่อๆ กันเป็นอนุกรม และมี Diode อยู่ภายในชิป (ทำให้มันเดินไฟทางเดียว) วัด Volt ค่อมชิป ต้องได้ 0.83V ขณะที่วัด Diode ต้องได้ 400 ทุกตัว
 CLK ต้องได้ 420 -480

กรณีชิปเสีย หรือไม่ ต้องถอดออกมาแล้ววัด Diode ต้องได้ 0.4 Impedence  ขึ้นไป หรือ ความต้านทานต้องได้ มากกว่า 10โอห์ม ถึงไม่เสีย

เซนเซอร์ อุณหภูมิ (Temp Sensor)
ความจริงมันเป็นการรวบรวมอุณหภูมิจากชิปทุกตัวกลับมาที่ตัวนี้ โดยมันต้องได้ไฟ 1.8V ที่ขา 1 กับ ขา 8 (ขา 2-3 รับ)  ส่วนขา 4 และขา 5 เป็น Groud (ขา 6 7 เป็นส่งกลับไป PIC chip) 

ชิปตัวที่รับภาระ คือ ชิปหมายเลข 5 จ่ายทั้งไฟ และ รับข้อมูล Temp เลย ดังนั้น  ต้องตรวจเช็คทั้งคู่

วิธีตรวจเช็ก 6 จุดของ L3+

1. ไฟเข้า 12 Pins ต้องเป็น 12 Volt
2. ขดลวด ตรงกลางบอร์ด และ C ด้านกลางซ้าย ต้องได้ 10 Volt 
3. Booster ขาเข้าต้องได้ 10V ขาออกต้องได้ 14V
4. LDO ขาออกต้องได้ 1.8 V
5. PLL (R 2 ตัวข้างมัน) ต้องได้ 0.8 V 
6. สัญญาณ 5 ตัว (รวมเป็น 10 ) 

การติดซิงค์ L3+
1 ทำความสะอาดด้วย แอลกฮอล์ก่อน ทั้งฝั่งชิปและฝั่งซิงค์  แต่เนื่องจากกาวยังติดแน่นอยู่ บางทีเราอาจต้องใช้ เครื่องหัวปั่นมาปั่นออกก่อน (ควรปั่นห่างจาก บอร์ด เพราะอาจมีเศษโลหะลงไปติดในบอร์ดได้)

ถ้าไม่มีหัวปั่น ให้ใช้ ตะไบขนาดเล็ก นั่งขัดก่อน
2 น้ำยา จะใช้ Themal Adhesive Artic Aluminium (จะเป็นอย่างดีสุด และแพง สีขาว ที่สำคัญติดโคตรแน่นเกินไป ) 

Case Study ดังนี้
กรณี Fix Feature บอกว่า ASIC = 0  หาบอร์ดไม่เจอ
ให้เริ่มต้นจากหา RX ที่ชิปตัวที่ 72 ก่อน เช็ค จิ้มหลังชิป กับ ช่อง RX ส่วนใหญ่จะไม่มี 1.8 V
ถ้าไม่มีไฟ 1.8 V  ให้กลับมาเทสที่  LDO ว่า มีไฟ 1.8 กับ 0.8 หรือไม่ (ขา 5 กับ Groud) 
ถ้าไม่มีไฟมา LDO (อย่าลืมว่า Domain ของชิปตัวที่ 72 คือ Domain 12 และ Domain 12 กับ 11 รับไฟมาจาก Booster )
สรุป เคสนี้ส่วนใหญ่ Booster เสียนั่นเอง แนะนำเปลี่ยนทั้งแผง Booster ไปเลย

ก่อนเปลี่ยน อะไหล่ตัวไหน  เราแนะนำให้ลองทำสายโยง(ในตำนาน) ก่อนที่จะเปลี่ยนชุด Booster เพื่อความชัวร์  (สายโยงคือ คือ C ที่ขั้ว + กับขั้วลบของ B1) ความหมายของสายโยงคือ มันดึงไฟจาก 12 V ไปจ่าย 2 Domian สุดท้ายแทน (ของอาจารย์จะ ลากไฟจาก ขั้ว 6 Pin มาเลย) 
เพราะ LDO ความจริงต้องรับไฟ 14V แต่ความจริง มันสามารถรับไฟได้แค่ 12V ก็ได้ แต่ มันควรใช้ชั่วคราวเท่านั้น

กรณี Fix Feature บอก ASIC =72
การ์ดเห็นครบ แต่ บางทีไฟจ่ายไม่พอ เราต้องไล่ไป LDO ไปเรื่อยๆ หากตัวไหน จ่ายไฟออกมาน้อย ก็ต้องย้อนกลับไปดูว่า DC-DC จ่ายไฟ 10 V หรือไม่ หรือ Domain ที่ 11-12 จ่ายไฟ 12V หรือไม่ 

ถ้า DC-DC เสี่อม มันจะจ่ายไฟไม่ถึง 10V ซึ่งควรเปลี่ยนชุด DC-DC เลย

กรณี ค่า Impedence ของแต่ละ Domain ไม่เท่ากัน  ............  ส่วนใหญ่ชิปช๊อต
กรณี ค่า Voltage ของแต่ละ Domain ไม่เท่ากัน .................  สัญญาณผิดปกติ ในบางจุด (โดยเฉพาะ อาจเป็นชิป หรือ R )
กรณี ชิปหาไม่ครบ 72 เน้นว่า กรณี เครื่องขุดแจ้งว่า  หาชิปไม่ครบ ไม่จำเป็นต้องเป็นชิปตัวนั้นที่หาย แต่มันสามารถเป็น Guide Line ได้ เช่น เกิน 36 ชิป ก็น่าจะอยู่ชุดหลัง เป็นต้น แต่ถ้าเจอน้อยๆ นี่ยากละ  แต่เราจะเน้นการหาสัญญาณไปที่ สัญญาณ  TX และ RX แทน CLK

กรณี ขั้วไหม้
กรณีนี้ อาจเกิดจาก การเสียบสายไม่แน่น
อีกกรณีคือ  PSU ที่แม้ว่าจะใช้ระดับ 1800W แต่ทำไมยังไหม้ เพราะแต่ละการ์ด อาจใช้ไฟสูงถึง  240W (คือ ไป Overclock เพิ่มทำให้กินไฟเพิ่มขึ้นด้วย) นั่นหมายความว่า PSU อาจจะจ่ายไฟพอ แต่สายไฟ(เหลืองดำ) ที่ต่อกับขั้ว 6 Pin ที่ใช้อยู่อาจมีขนาดที่เล็กเกินไป และนั่นจะทำให้ ขั้วไหม้ หรือสายไหม้ได้นั่นเอง ดังนั้นต้องตรวจสอบขนาดสายไฟด้วย

กรณี ชุด 10V ช๊อตหมด
เราจะเริ่มต้นด้วยการตรวจช๊อต Capacitor 3 ตัวบนก่อน  (ตั้งโอห์ม แล้วเริ่มต้นวัด จะได้ 0.9 จะค่อยๆลดลงมา) และ Capacitor 12V  เช่นกัน (สำหรับชุด 12 V)

มันเป็นไปได้ที่จะเป็น Capacitor (Filter ส่วนใหญ่ต่อลง Ground ทำให้ยากต่อการหา ) เพราะมันต่อขนานกับเส้นวงจร (ให้ลองจิ้ม หลังบอร์ด (ดำ) กับด้านซ้ายของ Capacitor ดู) 

การวัดค่า Cap จริงๆแล้วจะต้องเอาออกมาวัดข้างนอก โดยวัดค่า ความต้านทาน หากเพิ่มแล้วค่อยๆ ลด คือยังใช้ได้ แต่ถ้า โอห์มสูงตลอด คือ C ขาด และถ้าโอห์ม =0 (2ด้าน) เลย แสดงว่า C ช๊อตเรียบร้อย

อย่างไรก็ดี เราสามารถตัด วงให้แคบเข้าด้วยการ เช็คช๊อต ของขา LDO ก่อนว่า โดเมนนั้นช๊อตรึเปล่า ซึ่งโดเมนนั้นช๊อตก็มีโอกาสที่ Capacitor แถวนั้นจะช๊อตไปด้วย

กรณี 10V ไม่ออก

1 Mosfet เสีย (ตัวล่าง) ม้นจะช๊อตลง Ground ดังนั้น Volt  จะเหลือ 0 แต่ถ้าตัวบนเสีย (12V)  หรือช๊อตไฟ (PSU แบบอย่างดี มันต้องตัด แต่ใช้ PSU ห่วย มันไม่ตัด และอาจทำให้ไฟไหม้บอร์ดได้) 
2. ถ้ามา 12V  R แบ่งแรงดันเสียหรือไม่ 
3 ถ้า Mosfet 4 ตัวไม่เสีย ให้กลับไปเช็ค Diode ก่อน แล้วค่อยมาเช็ค ชิป 20 ขา

กรณี การ์ดไม่ยอมขุด หรือ รีสตาร์ท ทุก 2 ชั่วโมง 
แยกเป็น 2 กรณี ย่อย
1. อุณหภูมิการ์ดไม่ผ่าน Bitmain ออกมายืนยันเองว่า ถ้าอุณหภูมิชิปสูงเกิน 80C  หรือ ลงไปต่ำกว่า 0 C L3+ มันจะไม่ยอมขุด และรีสตาร์ท  ประเด็นนี้ ให้ดูไปที่ พัดลมว่า มันพัดเกิน 4000 รอบหรือไม่ ถ้าต่ำกว่านี้ ให้ระแวงไว้ก่อนว่า พัดลมเสีย หรือ เริ่มเสื่อมแล้ว เปลี่ยนก็จบ 

2. ไฟไม่นิ่ง เพราะ ไฟตก (ไม่ว่าจะ 10V หรือ 14V ร่วง นั่นคือ กระแสไม่พอ ทำให้ แรงดันไฟฟ้า Volt ลดลง) ส่วนใหญ่จะเดาว่า R ยืด ทำให้กระแสผ่านได้น้อยลง  หรือ ไฟที่ต่อ 230V ตกไปต่ำกว่า 220V 

หากขึ้น ชิปรายงานเป็น x เชื่อว่า ชิปตัวนั้นกำลังเสียหาย (ต้องลดกำลังขุดลง) หรือเห็นชิปเป็น 2 กลุ่ม x กับ o  คือ แนะนำให้ส่งซ่อมก่อน

กรณี Voltage คล่อมโดเมน ได้ค่าไม่เท่ากัน
ให้สงสัยว่า ชิปมีปัญหา หรือชิปช๊อต (ควรตรวจค่าโอห์ม ค่อมโดเมนด้วย ถ้าได้ค่า 0 ก็แสดงว่า มีโดเมนช๊อต ให้เปิดซิงค์ ตรวจค่า C  ว่าช๊อตมั้ยก่อนค่อย ยกวางชิป ต่อไป

กรณี Booster ออกแค่ 10V
ให้เดาก่อนเลยว่า LDO 2 Domain สุดท้ายช๊อต หรือ โหลด อยู่  (ตรวจสอบอาการ LDO ช๊อตด้วยการ ปลดขา 4-5 ออก แล้วตรวจว่า มีไฟ 1.8V ออกหรือไม่) อีกสาเหตุ คือ ชิปบางตัวช๊อต

กรณี ขุดไม่เต็มแรง
ต้องขุดได้ 120 แต่กลับขุดได้แค่ 88  เกิดจาก มีการช๊อตลงกราวน์บางจุด
ใน Kernel Log จะขึ้นว่า ไฟจ่ายไฟไม่เสถียร ดังประโยคนี้
crc5 error,should be 00,but check as 03 0 1

กรณี ขุดแล้วขึ้น xxx หลังจาก Reboot การ์ดหายไปเลย
หากเกิดกรณีนี้ แนะนำให้ รอให้ การ์ดนั้น เย็นแล้วเปิดอีกครั้งก่อน 1 ครั้งว่า เป็นที่อุณหภูมิการ์ดร้อนหรือไม่
โดยให้ตรวจ Kernel Log ด้วยว่า เจอประโยคนี้หรือไม่?

cgminer[393]: Get [1]Temp Data Failed!

ก็แสดงว่า Temp sensor มีโอกาสเสียแล้ว จับเปลี่ยนก็จบ แต่กรณี ไม่มีอะไหล่เปลี่ยน รีโฟลอีกทีก่อน เพราะส่วนใหญ่ เป็นปัญหาที่ตะกั่วมากกว่า
 

วันศุกร์ที่ 28 มกราคม พ.ศ. 2565

ASIC 101 : ซ่อม Antminer T17 T17+

AntMiner T17  T17+

Download คู่มือซ่อม T17  คู่มือซ่อม T17+(ภาษาจีน) Hex File T17

S17 และ S17Pro คือ ตัวเดียวกัน ใช้ชิป 1397AD เหมือนกัน แต่ S17Pro คือ การคัดเกรดชิปเท่านั้น ส่วน T17 นั้น Bitmain เลือกที่จะวางชิปจำนวนน้อยกว่า S17 ในพื้นที่เท่ากัน (30 VS 48 ตัว) ทำให้นักขุดมองในแง่ดีว่า T17 มีซิงค์ที่ใหญ่กว่า และทำให้หลายคนเชื่อว่า T17 จะมีประสิทธิภาพต่อการกินไฟที่ดีกว่า S17

แต่การที่มันเริ่มต้นกินไฟถึง 3,000W มันกินไฟเยอะมากๆ  ทำให้นักขุดมองว่า มันไม่ใช่อุตสาหกรรมในครัวเรือนแล้ว แต่มันคือ ASIC ระดับอุตสาหกรรม ไปแล้ว

ส่วน Series +  หรือ S17+ และ T17+  จะมีการออกแบบ Hashboard ใหม่ โดยใช้ชิปรุ่นที่ใหม่กว่า (แต่เป็นชิปเดิม MinorChange มากกว่า) คือ ชิป 1397AG ที่ใหม่กว่า 1397AD (รายละเอียดชิปแต่ละรุ่นจะอยู่ด้านล่าง)  S17/T17 เดิม และ Series+ ยังใส่ชิปลงไปในบอร์ดมากกว่าเดิม คือ 65 ตัว เทียบกับ S17 ที่ใส่แค่ 48 ชิป ชิปทั้งสองตัว ตามสเปคแล้วควรจะเหมือนกันหมดทุกอย่าง  แต่ความเป็นจริง ที่นักขุดก็ยังคงบ่นรุ่น 17 เช่นเคย คือ ซิงค์มันกลับไม่ได้รับการพัฒนาขึ้นเลยแม้แต่น้อย  แล้วยังวางชิปที่หนาแน่นกว่าเดิม ยิ่งทำให้ซิงค์เล็กลงอีก และเพิ่มโอกาสทำให้ซิงค์หลุดเช่นเดิม

ส่วน Seires E  หรือ S17e และ T17e นั้นจะค่อนข้างแตกต่างจากเดิมอย่างสิ้นเชิง พวกเขาเลือกใช้ชิป 1396 และวางชิปมากถึง 135 ชิป ต่อบอร์ด

อย่างไรก็ดี Series 15 และ 17 ยังคงเป็น เครื่องขุด ASIC ที่ควรหลีกเลี่ยง เพราะ ระบบการบักกรีที่ไม่ได้คุณภาพ และ PSU ที่คุณภาพต่ำ นอกจากนี้ มันมีพัดลมถึง 4 ตัวทำให้เสียงดังถึง 82 Db  และเน้นว่า เครื่องนี้ ต้องเสียบสายไฟทั้ง 2 เส้น และกินไฟถึง 2200-3000 W


สรุป
T17 (30Chip ซิงค์ใหญ่สุด และเย็นที่สุด มีปัญหาน้อยที่สุด ) 
T17+ (65 Chip ค่อนข้างแย่ ซิงค์เยอะ และชิปอยู่ชิดกันมาก โอกาสเสียจากชิปไหม้สูง ถ้าซิงค์หลุดเยอะ การซ่อมก็ไม่ใช่เรื่องง่ายๆ) 

PSU สำหรับ S17  T17  S17Pro  จะเป็นใช้ PSU รุ่น APW 9
PSU สำหรับ S17+  T17+  S17e  T17e จะใช้ PSU รุ่น APW9+

คำแนะนำในการตั้งค่าเครื่องนี้ ดังนี้
ให้ตั้งค่าความถี่ (FQ) 
ลงมาให้ได้อุณหภูมิที่ต่ำๆไว้ก่อน ( สำหรับ T17 ค่ามาตรฐานโรงงานอยู่ที่ 690) หรือ ลดการตั้งค่า การจ่ายไฟลง (ค่ามาตรฐานโรงงานจะอยู่ที่ 17.5 Volt) ที่สำคัญคือ จะได้ประหยัดค่าไฟด้วย และลดความร้อนลงด้วย

การตั้งค่า พัดลม เนื่องจาก T17 มีปัญหาเรื่องความร้อนสูงมาก จึงควรตั้งค่าพัดลม 80% ขึ้นไป แต่เสียงก็จะดังมากๆ  อย่างไรก็ดี หากพัดลมดับ เครื่องจะหยุดทำงานทันที ดังนั้น ควรสำรองพัดลมไว้ทั้ง พัดลม ASIC และ PSU แต่ประเด็น คือ รุ่นนี้ มันถอดมาเพื่อเปลี่ยนพัดลมได้ไม่ง่ายอย่างที่คิด 

อีกประเด็นคือ Hash Board  ตระกูลนี้ ก็มีปัญหาเรื่อง EEPROM  (บน HashBoard ไม่ใช่ Control Board)  โดยเป็นทั้ง Series S และ T หากมี Hash Board ที่เสียจำนวนมาก ควรซื้อเครื่อง Copy เฟิมแวร์จากเครื่องที่ดี แล้วไป Paste ลงเครื่องที่เสียเลย  เพราะเครื่องที่เสียส่วนใหญ่ 60% มาจากประเด็นนี้เลย

T17
เคส ก่อนอื่นมีคนยืนยันว่า มันสามารถใช้เคส ร่วมกับ S17 ได้  แต่มันไม่สามารถเสียบสลับกันไปมาใน Case เดียวกันได้

Specification
สเปคดั้งเดิมของ T17 จะมีแรงขุดที่ 40-42Th กินไฟ 2200-2500W ใช้ 3 การ์ด แต่ละการ์ดใส่ชิป (BM1397)  จำนวน 30 ชิป (Asic 0 คือ ตัว buffer ชอบตะกั่วร่อน  มันทำหน้าที่ รับส่งข้อมูล จะต้องผ่าน IC Buffer 2 ตัว (6 ขา) ที่คอยแปลงข้อมุลก่อนส่งออก 201(Tx) กับ 202(Rx)  มีหน้าที่ปรับกระแสกับแรงดัน เพื่อสื่อสารกับ IO
(ขา1 ต้องมี 3.3V  ขา 6 ต้องมีไฟ 1.8V)

ค่ามาตรฐานของเฟิมแวร์ทางการ คือ เครื่องจะหยุดรันเมื่อ 2 อย่างคือ
1. อุณหภูมิชิปสูงถึง 100 C 
2. อุณหภูมิบอร์ดสูงถึง 75 C


T17 Setting 
โหมดพัดลม มันจะอยู่ในค่า Silent Mode ในตอนเริ่มต้น (เพื่อให้ Temp Sensor ทำงานก่อน พอมันร้อน ค่อยเปลี่ยน Mode)

ตั้งค่า
 Downscale เมื่อชิปร้อนเกินไป (ถ้าร้อนมากเกิน 80 C แนะนำให้ถอดบอร์ดออกหนึ่งตัว โดยบางคนเชื่อว่า เอาการ์ดที่เสียมาไว้ตรงกลางจะดีที่สุด) อุณหภูมิจะลดลงมาพอดี หรือพัดลมตั้งที่ 100%

การตั้งค่าจ่ายไฟ PSU ค่ามาตรฐานตั้งไว้ที่ 17.2-17.5 V แต่เวปเมืองนอกจะแนะนำให้ตั้งค่าที่ 15.8-16.5V

การซ่อม
ส่วนประกอบ และการซ่อมระบบไฟ ของ HashBoard
1. เริ่มต้น เราจะดู Kernel Log ก่อนว่ามีอะไรผิดปกติหรือไม่ เช่น หาพัดลมไม่เจอ หาการ์ดไม่เจอ หรือ หากชิปไม่ครบ หรือ ปัญหาเซนเซอร์อุณหภูมิ จะได้ วิเคราะห์ปัญหาได้ใกล้เคียง

1.1 ถ้าเห็นการ์ด หรือ  ชิปบางส่วนแล้ว ยืนยันได้เลยว่า ไม่ใช่ PSU และพัดลม เสียแน่นอน

1.2 กรณี พบว่า Log รายงานว่า  เป็น Temp Sensor error เครื่องจะพยายามรักษาตัวเองด้วยการปิดการ์ดใบนั้น ทำให้เราไม่เห็นการ์ดใบนั้นทำงาน

แม้ว่า สันนิษฐานของหลายคนคือ Temp Sensor เสีย แต่มีหลายคนยืนยันว่า เมื่อเปลี่ยน Temp Sensor แล้วก็เปล่าประโยชน์ เพราะปัญหาไม่ได้เกิดจากตัว Temp Sensor เอง (เป็นไปได้ยากมากที่ Temp Sensor จะเสียพร้อมกัน 4 ตัว) แต่ปัญหาน่าจะเกิดจาก Chip ตัวสุดท้าย หรือ U1 (น่าจะอยู่ในชุด Booster) ที่จ่ายไฟมีปัญหามากกว่า รวมถึง PSU ที่จ่ายไฟไม่เพียงพอมากกว่า (ดังนั้นต้องย้อนกลับไปอ่าน Log อีกครั้งว่า Volt ที่จ่ายไฟให้แต่ละการ์ดถูกต้องหรือไม่ก่อน) แต่บางคนแนะนำให้ลงเฟิมแวร์ใหม่ หรือ  Flash PIC KIT ก่อน ขณะที่บางคน แค่ทำความสะอาด PSU และเปลี่ยนพัดลมก็หายเป็นปกติแล้ว ขณะที่บางคน แค่อุ่นอากาศรอบตัว รีสตาร์ทก็เปิดได้แล้ว มีคนใช้โปรแกรมทดลองแล้วพบว่า มันอ่านอุณหภูมิได้ค่าติดลบเฉยเลย)

2. เราจะเริ่มต้นถอดการ์ดที่มีปัญหาออกมาตรวจสอบด้วยสายตาก่อน โดยตรวจสอบฮีทซิงค์ก่อนเลยว่ามีล้มหรือไม่ เพราะถ้าซิงค์แตะกันเมื่อไหร่ หมายถึง ชิปมีโอกาสช๊อตกันสูง เพราะไฟลบของแต่ละโดเมน มันวิ่งถึงกันนั่นเอง 

ก่อนต่อสายไฟ เราจะเริ่มต้น การนับชิป และโดเมนก่อน
การนับชิปตัวที่  1 จากเริ่มจากตัวที่ใกล้ I/O Port มากที่สุด แล้วนับลงมา สลับฟันปลาไปมา
การ์ดจะใช้ ชิป BM1387  จำนวน 30 ตัว มี 10 Volt Domains แต่ละ Volt Domain  มีจะมี 3 ชิป (แต่ละชิปจะมี 34 ขา)

ความเข้าใจเกี่ยวกับ Volt Domain 
มันคือ  แต่ละโดเมนจะมีการส่ง ไฟฟ้าแรงดันโวลท์ไป ถ้า ระหว่าง โดเมน ผิดปกติ การ์ดนั้นจะดับ (ตรงนี้ อาจต้องใช้เครื่อง Text Fixture ตรวจ)

3. เริ่มต้นต่อสายไฟจาก PSU เข้าบอร์ด  คำเตือนแรกคือ   ห้ามต่อสายไฟสลับขั้วกันโดยเด็ดขาด มันจะมีแค่ขั้ว + (แดงอยู่บน) กับ - (ดำอยู่ล่าง) อ้างอิงตามรูปด้านบน 

ปกติ หากมีเครื่อง Test Fixture เราจะเริ่มเสียบจากตรงนี้

การทดสอบสัญญาณ ควรเริ่มต้นจาก ถอดซิงค์ (ยังไม่เสียบ) แล้วเทส แดงจิ้มหลังชิป ดำจิ้มรูทดสอบ ทดสอบด้วยการตั้งค่า โอห์ม จะต้องขึ้น 0 ทุกอัน (แต่จะมีอันหนึ่งขึ้น 2.6 โอห์ม)

วัดโวลท์ ด้วยการจิ้มกับหลังชิป
BO      0 V    (Diode 1200+-20) (ถ้าเจอ 1.8 แสดงว่า ชิปก่อนหน้าอาจเสีย ยกตัวอย่างเช่น เราเริ่มต้นที่ตัวสุดท้าย ได้ 1.8V ก็ไล่จิ้มจนกว่าจะเจอตัวที่ 0V นั่นเอง)
RST    1.7V   Diode 1200+-20)
RX RI  1.7V   (Diode 420+-20)
TX      1.7V  (Diode 1200+-20)
CLK    0.9V  (Diode 1200+-20)

LDO 1.8V    (Diode 400+-20)
LDO 0.8V    (Diode 20+-20)
(ก่อนวางชิป ต้องเช็ค R รอบชิปด้วยว่า ยืดหรือไม่ ค่าต้องได้เป๊ะๆ )

การวัด Voltage วัดจุดทดสอบ กับ ฮีทซิงค์ได้เลย
การวัดไดโอด เปลี่ยนเป็นโหมด Diode รูป Play+ pause โดยจิ้มหลังชิป + สัญญาณแต่ละตัวได้เลย

เริ่มต้น ตรวจสอบระบบไฟ
T17 จะใช้แรงดันของแต่ละโดเมนคือ 1.7 V มี 10 โดเมน
ดังนั้น ที่ขั้ว แรงดันรวมที่เข้าทั้งหมด คือ 17-21Volt ( ตัวบน คือ + ตัวล่างติดพอร์ต IO คือ -)  

เริ่มต้นให้วัดไฟที่ J6-J7 ควรมีไฟมารอที่ 17V (อยู่กลาางบอร์ดเลย เหมือน Cap หายแต่ความจริงมันคือที่ตรวจไฟเลย )

Mosfet 
เริ่มต้น  ไฟมันจะไปรอที่ Mosfet 4 ตัว  คือ Q7 Q8 Q9 และ Q11 (รหัส MDU3603 รุ่นนี้ Mosfet จะอยู่อีกด้าน จะมีชิประบายความร้อนอยู่ โดย Mosfet มันจะรอคำสั่งที่ขา 4 en ด้านล่าง ถ้าไม่ขุดต้องมีไฟ 0V แต่ถ้าขุดต้องมีไฟ 3.3V ส่งมาสั่งให้ Mosfet จ่ายไฟออก)

หาก Mosfet ไม่มีสัญญาณจ่ายไฟ ให้ย้อนกลับไปดู ขาที่ 1 ของ Q10 (Transitor 3 ขาที่รับจาก Pic Chip)  มีไฟ 3.3V หรือไม่ ถ้า Pic chip  ไม่มีไฟ 3.3V มา แสดงว่า PIC Chip  เสีย ให้ลง Firmware ใหม่ หรือ ให้ตรวจขาที่ 6 ด้านบน ว่ามีไฟ 3.3V มาจาก IO Port หรือไม่ โดย Pic Chip ก็จะไปสั่ง Q10 (Transitor (ชิปสีดำ 3 ขา เน้นไปที่ขา en (ขาเดียวๆ) เหมือนกับบอร์ด L3) มันจะเป็นตัวสั่งจ่ายไฟ 17.5 Volt (ขาเดียวของมันคือ เป็น O volt เมื่อไม่มีคำสั่ง และเป็น 3.3 volt เมื่อมีคำสั่งให้ขุด)

(จริงๆ เรื่อง Pic Chip ควรตรวจเจอตั้งแต่ในขั้นตอน Log File แล้ว เพราะจะมีคำว่า ERROR_PIC_LOST นั่นคือไม่ต้องไปใช้มัลติมิเตอร์ก็รู้ตั้งแต่อ่าน Log File แล้ว)

PIC KIT and Pic Chip
โดยปกติ ถ้าเราวางชิปใหม่ เราจะต้อง ลงเฟิมแวร์ใน Rom ใหม่ทุกครั้ง ผ่านเครื่อง PicKit 

ถัดมา  J6 กับ J7 ต้องวัดได้ไฟ 17-21 Volt (ไฟเริ่มต้น) มันจะแยกจ่ายไปแต่ละโดเมนอีกที

Booster (มันเป็นตัว Booster ไฟ ให้ ขึ้นไป 22-23V)

ระบบไฟด้านล่าง
ถ้าแรงดันไฟระหว่างโดเมนมาปกติ ให้เริ่มต้นด้วยการวัดสัญญาณ RI ของแต่ละชิปว่า มีแรงดัน 1.8V หรือไม่ (สัญญาณตัวนี้จะเริ่มต้นที่ชิปตัวสุดท้าย ไล่ไปทีละตัว)

LDO ตัวบน (1.8V) LN1134A182MR (รุ่นนี้ ส่วนใหญ่จะไม่เสีย แต่เสียที่ชิปมากกว่า)
กรณี ไม่มีทั้งโดเมน   หากไม่มีแรงดันไฟทั้งโดเมน เราจะเริ่มต้นการสืบสวนจาก LDO 5 ขา (จะมี 2 ตัว ตัวบน กับตัวล่าง (ตัวบน 0.8V ตัวล่าง 1.8V  

ขาที่ 1. ขาเข้า ต้องมีไฟเข้า 5.1 ( 3x 1.7) เวปเมืองนอกบอก 3.3 V
ขาที่ 2.  ขา Groud
ขาที่ 4. ไม่ได้ใช้งาน
ขาที่ 5. ขาออก ตัวแรกจะมีต้องมีไฟ 1.8V กับ 0,.8V (วัดเทียบบกับหลัง ซิงค์ได้เลย)

ถ้าขา 5 ยังออกไฟ 1.8V ปกติ ให้มาตรวจเช็ก ค่าความต้านทาน และตรวจสอบแต่ละชิป ว่าเสียหรือไม่ (ถ้าชิปเสียต้องถอดเปลี่ยนชิป) 

ถึงตรงนี้จะเห็นว่า โดเมน 9 ก็ไม่มีปัญหา แต่ปัญหาคือ โดเมนที่ 10 ที่ Volt อาจไม่พอ 

การกระโดดข้าม โดเมนก็เหมือนกัน คือ C และ R (อยุ่ด้าน LDO เหมือนเดิม) โดยข้ามที่ 3.3 Volt

LDO ตัวบน SGM1036 (ตัวเดียวกับ S17)
เข้าขา1 3.3V ออกขา 5 0.8V

T17+ จะใช้แรงดันรวมคือ 17.05V แต่ละโดเมนคือ  1.55V (วัดจริงต้องได้ 1.6V)  โดยจะแยกไปที่ LDO (L1134A182MR) จะมี 2 ตัว แยกเป็น ตัวจ่ายไฟ 1.8V กับตัวจ่ายไฟ 0.8 V (SMG2036-ADJYN5G/TR) U117 , U152 (ตรวจไฟจาก Capacitor ตามตำแหน่งด้านล่าง มันง่ายที่สุดแล้ว)


โดยยังคงต้องเช็คสัญญาณ ทั้ง 5 คือ CLK-CO-RI-BO-RST

ยกตัวอย่าง หาก ตัวทดสอบบอกว่า ชิปตัวที่ 3 เสีย  เราจะทดสอบดังนี้

ก่อนอื่นถอด PSU ออกก่อน 
1. ใช้ สีแดงของมัลติมิเตอร์แตะกับ ฮีทซิงค์ และ ขาดำ เสียบทดสอบทั้ง  5 สัญญาณ (สีดำห้ามแตะกับฮีทซิงค์ไม่งั้นอาจลัดวงจรได้)

3.1 กรณี (Asic = 0) 

3.2  ถ้าแหล่งจ่ายไฟจ่ายไฟมาแต่ละโดเมนเป็นปกติ และมีไฟในแต่ละ Domain ก็มาดูที่สัญญาณ RI ของชิปที่ควรจะวัดค่าได้ 1.8Volt (เริ่มวัดจาก ชิปตัวสุดท้าย) ไล่ตรวจไป ถ้าชิปตัวไหนไม่มี ก็ไล่ย้อนกลับไปถึง แหล่งจ่ายไฟ LDO (LDO คือตัวแบ่งจ่ายไฟจากแรงดันไฟฟ้ารวม ให้ไปตรวจ LDO ตัวที่ 1 ก่อนเลย)  ไปถึง Power Supply ไปถึงชิป  ถ้าขาดไฟช่วงไหนเช่น LDO ก็แสดงว่า LDO เสีย หรือ มีปัญหาเรื่องตะกั่ว (ให้ลองใส่ตะกั่วใหม่เข้าไป) หรือทดสอบความต้านทานของชิป 

กรณี Test Point ชิปแล้ว ยังไม่รู้ ให้มาตรวจ ความต้านทานรอบชิปอีกที (เทียบกับบอร์ด) ถ้าความต้านทานปกติ ก็แสดงว่า ชิปนี้มีปัญหาแล้ว ให้เปลี่ยนชิป)

3.3 กรณี สัญญาณ ASIC =7
การอ่านแบบนี้ คือ สามารถพบชิป 7  ตัว และมีปัญหาตัวที่ 8 (อาจเป็นตัวที่ 6 หรือ 7 หรือ 8 ) เราจะเริ่มต้นวัด Voltage ของชิปตัวที่ 7 ทั้ง U198 CLK RST CO ดูว่าแหล่งจ่ายไฟผิดปกติหรือไม่ CLK = 0.8 Volt มั้ย (ถ้าไม่ใช่ ให้ย้อนกลับไปตรวจ แหล่งจ่ายไฟว่ามาถูกต้องหรือไม่ โดยต้องไล่กลับไปที่ LDO ที่เป็นแหล่งจ่ายไฟอีกครั้ง)

บางคนบอกว่า บางทีฮีทซิงค์มันเริ่มหลวม เอามือบีบมันเบาๆ ก็อาจกลับมาได้ หรือให้ดี ให้เอากาวทาใหม่ก็จบ แต่บางคนบอกว่า ชิปมันบักกรีด้วยตะกั่ว Free ทำให้เมื่อมันเก่า มันมีโอกาสแครกสูงให้ลอง ReFlow ดูก่อน

4.Temp Sensor 
อย่างที่บอก Temp Sensor นั้น เป็นปัญหาของรุ่น T17 มันใช้ชิป T451 เพื่อรวบรวมข้อมูลอุณหภูมิ  และการ์ดหนึ่งแผ่นจะมีจำนวนถึง  4 ตัว (ต้องถอดฮีทซิงค์ของชิปออกก่อนถึงจะเห็น) ที่สำคัญคือ ถ้าบอร์ดหา เซนเซอร์ อุณหภูมิไม่เจอ การ์ดจะไม่ทำงาน 

วิธีวิเคราะห์ปัญหานี้คือ เมื่อดูหน้า Status จะไม่เห็น อุณหภูมิ และ เมื่อดู Kernel Log จะแจ้งเลยว่า ไม่พบอุณหภูมิ read temp sensor failed 

แต่ประเด็นนี้ บางทีช่าง ถอดเปลี่ยนชิปอุณหภูมิก็ไม่ช่วยอะไร เพราะชิปไม่ส่งสัญญาณอุณหภูมิออกมาอยู่ดี ที่สำคัญ ส่วนใหญ่เกิดจากชิป U1 หรือแรงดันชิปตัวสุดท้ายตก (หรือชิปแฮชไม่แนบไปกับซิงค์ และไม่ส่่งค่าอุณหภูมิให้ Temp  Sensor มากกว่า) 

หรือ บางทีอาจต้องอัพเฟิมแวร์ของ hashboard เพื่อแก้ปัญหานี้  นอกจากนี้ การสลับบอร์ด ไปมา (ค่า Volt จะไม่เท่ากันทุกบอร์ด) ทำให้ ข้อมูลอุณหภูมิถูกเก็บต่างกันอีกด้วย

ประเด็นปัญหาที่แท้จริง ของ T17  คือ ตะกั่วที่บริษัทผลิตมาไม่มีคุณภาพ เพราะเป็นตะกั่วไร้สารตะกั่ว ทำให้มันมีปัญหา เกิดฟองอากาศและรอยแตก ทำให้ไฟในชิปเดินไม่ปกติ ( ปัญหานี้เกิดทั่วไปในวงการอิเลกโทรนิกส์ทั่วโลกในยุคนั้น) ถ้าจะถอดต้องใช้ Flux ที่ไม่ต้องทำความสะอาด (No Clean)  แต่แนะนำให้ ReBall  ด้วยปืนความร้อน 350-380 องศา ก่อนจะดีกว่า)

แต่สิ่งแรกที่แนะนำคือ เปลี่ยน พัดลมเป็น Delta 2.6A ทั้ง 4 ตัวจะดีกว่า นอกจากลดการสั่นแล้ว ยังเย็นกว่าด้วย



ตำแหน่ง Temp Sensor ที่ Log มักรายงานว่าเสีย

 
        ชิป 2 ตัวนี้ที่แนะนำให้เปลี่ยน


T17+
ก่อนอื่น เส้นลวดเหล็กที่เป็นตัวรับไฟ ตัวนี้ต้องสะอาด และ ป้องกันหลีกเลี่ยงการลัดวงจรระหว่างซ่อมบำรุง  เพราะมีกระแสไฟสูงถึง 21V

ประเด็นสำคัญของ T17+ คือ แฮชบอร์ดนั้นมีหลายรุ่น ดังนั้นจะลงเฟิมแวร์ต้องดูให้ดี ว่า ถูกตรงรุ่นหรือไม่

*** ห้าม OC เกิน 800 เด็ดขาด มีคนเสียทันทีเพราะมันมาแล้ว**

1. ให้ไปตรวจที่ LDO ก่อนว่า จ่ายไฟ 1.8V และ 0.8V หรือไม่ หากผิดปกติ ให้ย้อนกลับไปตรวจที่ วงจร Booster โดยวงจร Booster จะจ่ายไฟมาที่ 23V
2 ถ้าชิปไม่สมบูรณ์ ให้ ถอดมาบักกรีใหม่ หรือ เขียน Firmware ใหม่ (ต้องใช้ ไฟล์ Hex กับเครื่องมือ PicKIT3)  รวมไปถึงตรวจสอบ Mosfet ว่า มีลัดวรจรหรือไม่ 

ห้ามสลับบอร์ด
สิ่งสำคัญที่หลายคนมักจะพลาดคือ เมื่อเอา การ์ดอื่นมาเสียบแทนการ์ดเดิมของ Series ตั้งแต่ 9 ขึ้นไป (จริงๆ Hash Board จะถึงแค่ S9i คือ S9 กับ S9i ถึงจะสลับกันเครื่องกันได้)  มันห้ามเสียบข้ามเครื่องกัน ยกตัวอย่างตามรูป  คือ แม้แต่รุ่นเดียวกัน แต่คนละ ซีรียส์ ก็เสียบข้ามไม่ได้ 

ดังนั้น ถ้าถอดออกมาเพื่อทำความสะอาด เราแนะนำว่า ให้ทำทีละเครื่องเท่านั้น ห้ามทำหลายๆ เครื่องพร้อมกัน เดี๋ยวจะพลาดสลับบอร์ดได้ ทำให้ การ์ดบางการ์ดไม่ทำงานได้



การติดฮีทซิงค์สำหรับรุ่นนี้
1. ทำความสะอาดทั้ง 2 ด้าน (ถ้ามีฟลักซ์เก่า ต้องทำความสะอาดให้หมด ซิงค์ก็ใช้มีดขูดออกให้หมด แล้วใช้โซเวลท์ทำความสะอาดอีกครั้ง) 
2. เอาตะกั่วไลท์บนซิงค์  (ต้องใช้ตะกั่วน้อยมากๆ ไม่งั้นมันจะไหลไปโดนขาได้ ตรงนี้ยากมากๆ และต้องวางให้ตรง ไม่งั้น ตะกั่วจะไหล แล้วใช้ปืนความร้อนตั้งที่ 350 แล้วเป่าให้ทั่ว )
3. ฉีดฟลักซ์ เล็กน้อยลงบนชิป (นิดเดียวจริงๆ)

Firmware 
แนะนำให้ใช้ Firmware 
thierry4wd (Djay)      สามารถลดลงได้ถึง 1500W เลยทีเดียว และไปได้สูงสุดถึง 80 Th โดย Dev Fee 2%
 Asic.To จะสามารถ Downvolts to 1900w at 42th/s  และได้ 42.5w/ths (มันไปได้ไกลถึง 65Th เลยทีเดียว) แต่มันคิดค่า Fee 2.8% เลยทีเดียว
Awesome Miner 
ค่า Dev Fee 1.8-2.8%

T17+ สเปค
การด์ใช้ชิป BM1397 (ต่างกับ T17 เป็น BM1387)  44 ตัว มี 11 Voltage Domains และแต่ละ Domain มี 4 Chips

2) The working voltage of the BM1397 chip used by T17 + is 1.55V, and the chip is equipped with LDO to supply VDDIO 1.8V, VDDPLL 0.8V power supply.

3) The T17 + clock is a 25M crystal oscillator, which is transmitted in series from the first chip to the 44th one.


PSU APW9 and APW9+
วิธีสังเกต คือ ข้าง 6 Pin APW9+ จะมีรู 2 รู  แต่ทั้ง 2 รุ่นแม้จะเหมือนกันในทางกายภาพ และอิเลกโทรนิกส์ แต่จริงๆ แล้วพวกมันใช้แทนกันไม่ได้ เพราะ PIC Control ที่ถูกโปรแกรมมาต่างกัน ดังนั้น ต้องใช้ PICKIT มาก็อปปี้ใส่ ถึงจะแปลงไปมาได้ 

มันคือ PSU คุณภาพสูง ที่จ่ายไฟเข้า (2 เส้น) แต่รวมกันเป็น เส้นเดียว และแตกออกมาเป็น DC 2 เส้น
เส้นแรกคือ 14.2-21Volt  สูงสุดที่ 170 A หรือ 3600W (เป็นแบบปรับค่าไฟได้ ถูกควบคุมโดย PIC และสื่อสารกับ ตัวขุด เส้นนี้ ควรวัดไฟให้ได้ที่ 21.32Volt )
เส้นที่สอง คือ 12 Volt สูงสุดที่ 12A (เป็นแบบปรับค่าไฟไม่ได้)

เส้นแรกแยกเป็น 3 ส่วน
1A - The first AC input and EMI circuit  (ต้องมีไฟเข้าที่ 220V)
1B - PFC and MOS circuit
1C - 12V auxiliary circuit and VCC circuit
เส้นที่ 2 แยกเป็น 4 ส่วน
2A -  2nd AC input and EMI circuit
2B - PFC and MOS circuit
2C - 12V auxiliary circuit and VCC circuit
2D - 12V output port and PIC communication port (Output ของ 12Volt ต้องมีไฟ 12A ตลอด)

พัดลมจะใช้เบอร์ 4028

วิธีการตรวจสอบ APW9
1. ตรวจสอบด้วยสายตา มีอะไรผิดปกติหรือไม่ พัดลมทำงานรึเปล่า (ถ้าพัดลมไม่ทำงาน ให้ตรวจไฟ 220V ก่อนทำอย่างอื่นเลย)
2. เสียบไฟ 220V แล้วตรวจว่า มีไฟ 12V ออกหรือไม่ (ตรวจแล้วต้องได้ค่า 12.1-12.5V)  ถ้าไม่มี เริ่มแรกให้ตรวจ ไฟเข้าต้องมากกว่า 205V  หรือ อาจมีวงจรช๊อตได้)
3. กรณี  PSU เปิดๆ ปิดๆ ให้ตรวจ อุณหภูมิก่อนเลย เช่น พัดลม  และ ฝุ่นให้ทำความสะอาดก็เพียงพอแล้ว
4. เปิดเครื่องมา ตรวจสอบ ตัวเก็บประจุ มีระเบิดหรือไม่ เพราะกระแสจะไม่นิ่งถ้า Cap ไม่นิ่ง รวมถึงตรวจสอบฟิวส์ก่อนเลย
5 เปิดเครื่องแล้ว เครื่องรันปกติ แต่พัดลมไม่หมุน มีโอกาสที่ สัญญาณจากเครื่องขุด หรือ พัดลมเสีย
6 เปิดแล้วไม่ติด ให้ตรวจรระบบ OverCurrent เป็นหลัก 


อะไหล่ T17 สั่งกับ Virat Lee
NCP1654BD65R2G  30บาท
-MP1517DR-LF-Z 70 บาท
-Inductor 100 12 บาท
- cap 330uf 30V 10x12mm 30 บาท
- cap 330uf 2V SMD  22 บาท
-MBR0540 5 บาท
-2N7002 5 บาท
-MDU3603 
-SN74LVC1T45DBVR 18บาท
-SGM2036-ADJYN5G/TR 5 บาท

วิธีการ ติดซิงค์ แนะนำให้ติดด้วย กาว  Arctic Silver หรือ Arctic Alumina ราคาค่อนข้างแพง เดิมที่มาจากโรงงานคือ ตะกั่วบักกรี ที่ทนอุณหภูมิได้ไม่เกิน 135C เท่านั้น (ขณะที่เราเตือนคุณก่อนว่า การใช้กาวดำ ใน L3+ และ S9 มาใช้นั้น เนื่องจากกาวระบายความร้อนได้ไม่ดีพอ ทำให้ ชิปเสียมาเยอะแล้ว)

*** ตัวชิปมุมล่าง มักจะถูก Burn เสมอ เพราะเป็นมุมอับ

ที่สำคัญคือ ต้องดูให้ดีว่า ชิปหลุดจากบอร์ด หรือ ซิงค์หลุดจากชิป ประเด็นนี้หลายคนตกม้าตายมาเยอะ

กรณี บอร์ดตาย 1 ตัว
1.1ให้ลองสลับสายสัญญาณเสียบ เพื่อยืนยันว่า Control Board ของ T17 หรือ สายไม่เสีย 
1.2 ให้ลองขัดน๊อต และขยับสายเสียบสายไฟอีกครั้ง ทั้งฝั่ง PSU และฝั่ง Hash board ให้ดีอีกครั้ง
1.3 การอบการ์ด หรือ แช่ในตู้เย็น ก็มีคนสามารถซ่อม T17 สำเร็จมาเยอะแล้ว (20%)

กรณี ชิปเสีย เปลี่ยนไปเรื่อยๆ 
เกิดจากการกินกระแสที่หนัก และทำให้แรงดันผันผวน (ให้สังเกตุ การกินกระแส เวลาขุด ประมาณ 5 แอมป์) แต่บอร์ดที่เสียจะกินกระแสสูง 7 -10 แอมป์ (กรณี นี้อาจะเป็นที่ชิปช๊อต แต่มันจะต่างกัน ตรงที่ เปิดเครื่อง จะกิน 10 แอมป์เลย ) หากเป็นค่อยๆ เพิ่มการกินกระแส  (อาจารย์ใบ้ว่า มันคือตัวที่สั่ง PIC ให้ปรับไฟขึ้นลง)

กรณี ชิปเป็น 0 ส่วนใหญ่เกิดจาก Booster ที่มีแรงดันต่ำเกินไป (อย่าลืมว่า ต้อง 24 V )



Fix ASIC102 : ซ่อม T17e

 T17e

Download
คู่มือภาษาอังกฤษ  file Hex

ปัญหาประจำรุ่น Series 17
เนื่องจาก การบัดกรีและกาวยึดติดซิงค์ที่ไม่ดี ส่งผลให้ฮีตซิงก์คลายตัว และส่งผลต่อ ไฟฟ้าลัดวงจร ชิปไหม้ และ แฮชบอร์ดล้มเหลว

ผู้เชี่ยวชาญชี้ว่า ชิปมีโอกาสถูกเบิร์น จาก ตะกั่วที่ไม่ได้คุณภาพสูงมาก อย่างไรก็ดีการยกชิป และวางชิป แม้จะเป็นการซ่อมที่ดี แต่มันก็มีค่าใช้จ่ายสูงมาก

อีกประเด็นคือ การสลับการ์ด  เครื่องแต่ละเครื่องนั้น ไม่ควรสลับการ์ดกับเครื่องอื่น แต่หากจำเป็น ก็สามารถแฟลชเฟิมแวร์ก็ช่วยเรื่องนี้ได้

แต่ปัญหาที่แท้จริง  ดังนั้น Series 17 ทั้งหมดมีการแปลงไปใช้ ซิงค์แบบของรุ่น S19 (อันนี้ต้องทำที่จีน เพราะมีการถอดซิงค์ ถอดชิป เจาะรู  แล้วประกอบใหม่ ซึ่งมีค่าใช้จ่ายที่แพงมาก แต่ได้ประสิทธิภาพที่ดีที่สุด


Control Board 
รุ่น T17e จะใช้ Control Board ตัวเดียวกับ S17+ , T17+, S17e และ T17e แต่มันจะใช้ไม่ได้กับ S17 , S17 Pro และ T17 (T17 ไม่มี Pro) นอกจากนี้ Power Suppy  ก็แยกกันเช่นกัน กลุ่มแรกจะใช้รุ่น APW9+ กลุ่มหลังจะใช้รุ่น APW9 (ห้ามใช้สลับกันเด็ดขาด)

ปัญหาที่ Control Board

กรณี  เปิดแล้วไม่ทำงานเลย

กรณีที่ 1   ถ้าพัดลมไม่ทำงานเลยสักตัว นั่นคือ PSU ไม่ทำงาน หรือไม่จ่ายไฟ (ให้ชัวร์ให้ใช้มัลติมิเตอร์ตรวจที่ฝั่ง PSU เลย) แบบนี้ แก้ไขได้โดย การเปลี่ยน Power แล้วลองอีกครั้ง

กรณีที่ 2
  เปิดแล้ว พัดลมไม่ทำงาน เช่นกัน  หรือ พัดลมทำงาน แต่ระบบไม่ขุด  กรณีนี้ ให้ลองเข้า Kernel Log แล้วลองหาคำว่า fan_speed =0 (มี 4 ตัวต้องเจอทั้งหมด) ถ้า Detect พัดลมไม่เจอ มันจะไม่เริ่มตรวจชิป แก้ไขด้วยการเปลี่ยนพัดลม ตอนแกะเครื่องระวังอย่าให้น๊อต หรือ ไขควง ตกลงไปกระแทบ Control Board ไม่งั้น อาจเสียหายได้

กรณีที่ 3 พัดลมทำงานแล้ว แต่ไฟ Control Board กลับไม่มีไฟ เกิดได้ 2 กรณี คือ 
อย่างแรก CPU เสีย (ไม่คุ้มที่จะซ่อม)ให้เปลี่ยน Control Board 
อย่างที่สองคือ คือ สาย Power 6 Pin หรือ สายสัญญาณ (ระหว่าง Control Board กับ PSU ) อาจขาดใน (แนะนำให้หามาเปลี่ยนให้เรียบร้อยก่อน)  ถ้าเปลี่ยนแล้วยังเหมือนเดิม ให้เดาก่อนเลยว่า CPU เสีย

Hashboard  T17e
ภาพรวม

1 บอร์ด จะมี ชิป BM1396AB  ทั้งหมด 78 ตัว โดยมี 13 Voltage Domain โดเมนละ 6 ตัว  

ประเด็นที่แตกต่างกันในแต่ละการ์ด คือ  (ดูได้ใน Kernel Log) 
1. temp sensor จะมี 2 รุ่น คือ  NCT218 และ  TMP451
2. ตัวชิป แม้จะเป็น BM1396AB แต่การ์ดกลับระบุต่างกันคือ A3V1 (ตัวแรกจะกินไฟที่ 18V) กับ A4V4 (ตัวหลังส่วนใหญ่จะต้องจ่ายไฟที่ 18.40V มันเป็นประเด็นคือ มันใช้แรงดันไฟเยอะกว่า นั่นเอง) 



ระบบไฟรวมดังนี้
ไฟเข้าที่ DC Socket ( สายลบ - จะอยู่ติดกับ IO port    ส่วนสายบวก + แรงดันไฟจะต้องจ่ายมาที่ 18-21Volts)

Mosfet 
ไฟจะวิ่งมารอที่ Mosfet เพื่อรอ สัญญาณ en เพื่อเปิดสะพานไฟ (วัดช๊อต ตามรูปด้านล่าง)

ระบบไฟ เริ่มต้นจาก 18-.21V  จ่ายไฟแยกเป็น 2 สาย ดังนี้
1. DC-DC ปกติจะจ่ายไฟให้ ออกที่ 21V แยกไป 13 Domain  (18V/13) จะได้โดเมนละ 1.35-1.4 V

จิ้มคล่อมซิงค์ได้เลย ขณะที่ตรวจโดเมนแรกกับสุดท้าย จะต้องได้ 17.35-21V  โดยแรงดันไฟฟ้าแต่ละ Domain ต้องต่างกันไม่เกิน 0.2Volt หากต่างกันเกิน แสดงว่า โดเมนที่ต่างนั้นมีโอกาสเจอชิปเสีย 

2. Booster ไฟเข้าที่ 21V ออก 24.5V  เพื่อแจกไป 2 Domain สุดท้าย 


ไฟสำหรับ T17e จะเข้าที่ 18- 21 Volt ไฟระหว่าง Domain คือ 1.35-1.4 V (จิ้มคล่อมซิงค์ได้เลย ขณะที่ตรวจโดเมนแรกกับสุดท้าย จะต้องได้ 17.35-21V  โดยแรงดันไฟฟ้าแต่ละ Domain ต้องต่างกันไม่เกิน 0.2Volt หากต่างกันเกิน แสดงว่า โดเมนที่ต่าง มีโอกาสเจอชิปเสีย

LDO สำหรับ T17e จะใช้ LDO 2 ตัว ต่อ 1 Domain เพื่อจ่ายไฟ 1.8V กับ 0.8V (ขณะที่ L3+ใช้ R แบ่ง แต่ T17e จะใช้ LDO แยกจ่ายไฟไปเลย)

LDO ตัวแรก U131 มี 9 ขา MP2019 รับไฟจาก Booster 2.4V ที่ขา 1 และออกที่ขา 4 1.8V


กรณี ตรวจพบ  0 ASIC (ระบบจ่ายไฟน่าจะมีปัญหา) 
1. ตรวจสอบตรงที่ วงกลม ตามรูป ว่า ไฟเข้าหรือไม่
R55  10K               C44  110nF 50V
R56  270                
C30  22nF 50V


2. ตรวจสอบ Mosfet 4 ตัว (Q1 Q2 Q3 Q4)
Mosfet 4 ตัวรหัส TPHR9003NL (เสปคคือ เข้าไม่เกิน 30V (มันจะรับ 17-18V ออกไม่เกิน 20V (ออก 17-18V เช่นกัน)

โดยเฉพาะ การวัดว่ามันช๊อตรึเปล่า ค่าแรงต้านทาน ของขา 1 4 8  มันจะแยกจ่ายไปแต่ละโดเมน ว่าจ่ายไฟออกถูกต้องหรือไม่  (17-18V) ถ้ามาถึงตรงนี้ แสดงว่า มันจ่ายไฟไปแต่ละโดเมน และ Booster ได้แล้ว

กรณี Mosfet ไม่จ่ายไฟ
3. ตรวจสอบ PIC Chip (U3 , PIC16F1704-1)
ขา 1 รับไฟเข้า 3.3V
ขา 2 ขา en รับไฟเข้า 3.3V เช่นกัน (ถ้าไม่มี แสดงว่า ไม่มีสัญญาณสั่งให้ทำงาน)

ถ้าไฟ Mosfet ไม่จ่ายออก ให้กลับมาดู ว่า ขา en ของ pic ทำงานรึเปล่าด้วย ถ้าไม่ทำ ให้แฟลชไบออสใหม่

โดยในโปรแกรม PicKit ก็ให้เลือก Power>> Power Taget Curcuit from tools 
ส่วน Operate >>  Chip >> PIC16F1704 

4. ตรวจสอบวงจร Booster 

ไฟเข้า 17-21V  ออก 24.5V  เพื่อไปจ่ายไฟให้ 2 โดเมนสุดท้าย โดยให้ตรวจสอบ D5/D8 (หาไม่เจอ อยู่ตรงไหน) ในวงจร

ชิปดำ 16 ขา  U6 คือ ชิป MP1517DRQFN-16   25V 3a 
ส่วน   Diode  D4 คือ ชิป MBR0540 เป็น Diode  40V 0.5a
สิ่งสำคัญคือ  R61 300k (Rfb), R60 10k  R62 20K  C62 10nF/50V และ  R64 15k(Rfb)

หลักๆ จะจ่ายไฟไปที่ 1.8V 



5. ตรวจสอบ LDO ของแต่ละ Domain
LDO แบบ 8 ขา U131 MP2019GN     ไฟเข้า  2.4V (กระจายกันเข้า) แต่จะมีไฟออกที่ขา 1  1.8V
LDO แบบ  6 ขา U112 U113  SY812G (ไฟเข้าขา 5 ) ออก ขา 1 แรงดัน  1.8V เพื่อจ่ายไปให้ LDO 5 พินตัวถัดไป
LDO แบบ 5 ขา U25 U26 U27 U8 U9 SGM2036  ไฟเข้าขา1 2V    ไฟออกที่ขา5 0.8 V
R1003 or
R

ชิป 8 ขา

 ชิป 5 ขา เข้า 3-4.5V ออก0.8V

 ชิป 5 ขา เข้า ??V  ออก0.8V


(ถ้าไฟไปไม่ถึงชิป ไม่ว่าจะ 1.8 หรือ 0.8V มันจะไม่มีสัญญาณ  CO CLK
โดยสามารถวัดแรงดันไฟที่ส่งให้ชิปแต่ละตัวได้ตามรูป ด้านล่าง
    

6. กรณี เกิดปัญหาที่ Temp Sensor 
ต้องตรวจสอบ การเดินไฟ และ ตะกั่ววางชิป ให้ดี

7. ตรวจสอบภาคสัญญาณ


ชิปดำๆ  2 ตัวเป็นตัวรับส่งสัญญาณ ของ CI และ RI ก่อนส่งผ่านให้ IO Port

1. CLK  เริ่มต้นจาก Oscilator 25M (Y1)  จากชิปตัวที่ 1-44 วัดค่าจะต้องได้ 0.7-0.9V
2. TX สัญญาณเริ่มที่  ขาที่ 7 ของพอร์ต IO (3.3V) วิ่งไป แปลงสัญญาณที่ U2  (คนไทยเรียก buffer) แล้ววิ่งไปที่ ชิปตัวที่ 1-78  วัดตอนไม่ทำงานจะต้องได้ 0V เมื่อทำงานต้องได้ 1.8V
3. RX สัญญาณเริ่มที่  ชิปตัวที่ 78 -1 กลับไป  ขาที่ 8 ของ U1 (Buffer)  เมื่อไม่ได้เสียบ IO จะวัดได้ 0.3V เมื่อเสียบจะวัดได้ 1.8V
4. BO จะวิ่งจาก ชิปตัวที่ 1 ไปถึง ตัวที่ 44 วัดได้ 0V
5. RST จะวิ่งจาก IO วิ่งไปชิปตัวที่ 1-78 วัดได้ 1.8V

ดังนั้น ถ้าชิปตัวแรก บักกรีมาไม่ดี มันมีโอกาสที่จะโชว์ ASIC=0 ด้วย

แผงควบคุม
จะเกิดกรณี hashboard ทั้งหมดไม่ทำงาน 








และตรวจสอบค่า R รอบ พอร์ต



กรณี เห็นการ์ดบางใบ ASIC =0 
เมื่อ Kernel Log เริ่มทดสอบ จำนวนชิปของแต่ละบอร์ด 
(Chain 0 = บอร์ดที่ 1
Chain 1 = บอร์ดที่ 2
Chain 2 = บอร์ดที่ 3) 
เราแนะนำว่า ถ้ามีปัญหา 1-2 บอร์ด ให้ดึงบอร์ดที่ดีออกก่อน เผื่อว่า ไฟมันจ่ายไม่พอ ทำให้บอร์ดที่ดีกลายเป็นบอร์ดเสียไปได้

อีกกรณี คือ หา IP ไม่เจอ แยกเป็น 2 กรณี ย่อย
1. สายแลนไม่ดี  
2. CPU เสีย (ไม่คุ้มที่จะซ่อม) ให้เปลี่ยน Control Board ใหม่)

สุดท้ายคือ 
หายังมีปัญหา ให้ลง Firmware ใหม่(แนะนำให้ลง แบบ SD Card เพื่อล้าง Memory ไปในตัวเลย) 
แล้ว Setting เป็น Normal Mode (เพราะหากไปตั้งค่าเป็น Sleep Mode บางทีมันอาจไม่ทำงาน)

รายการอะไหล่ 
อะไหล่T17&S17
MP2019GN 65บาท                        LDO 8 ขา
SGM2036-ADJYN5G/TR 5 บาท   LDO 5 ขา
NCP1654BD65R2G  30บาท
-MP1517DR-LF-Z 70 บาท   ชิป  Boosetr
-Inductor 100 12 บาท
330uf 30V 10x12mm 30 บาท
-MBR0540 5 บาท            Diode Booster 
-2N7002 5 บาท
-MDU3603 18 บาท
-SN74LVC1T45DBVR 18บาท

-330uf 2V SMD cap. 22 บาท
Inductor 100&220 ตัวละ12
DS pic 33ep16 18206EV 75บาท

รวม Kernel Log 
thread.c:309:is_temp_reopen_core: current chip max temperature(86) is too high, >= 86
อุณหภูมิร้อนเกิน 85 C


check_adc_voltage: FAIL domain volt check: chain 1 domain 11 volt 0.000 less then request 0.800 (index 0)
มีปัญหาจ่ายไฟ การ์ดที่ 2 (Chain 1) โดเมนที่ 12 (เวลานับ มันนับ Domain 0 คือ Domain ที่  1 ดังนั้นถ้าเป็น Kernel Log ระบุเป็น Domain 11 ต้องเป็น โดเมนที่ 12 แต่ประเด็นคือ โดเมนที่ 12 -13 คือ 2 โดเมนสุดท้ายที่รับไฟจาก Booster นั่นคือ ไม่ LDO (LDO ก็มี 2ตัว) ก็ Booster เสียนั่นเอง 

-------------------------------
2022-02-17 16:48:50:auto_adapt.c:100:_get_board_info: chain[0] board bin: 1, chip bin: 4, chip ft: A3V1, chip version: AD
2022-02-17 16:48:50:auto_adapt.c:100:_get_board_info: chain[1] board bin: 1, chip bin: 4, chip ft: A3V1, chip version: AB
2022-02-17 16:48:50:auto_adapt.c:100:_get_board_info: chain[2] board bin: 1, chip bin: 3, chip ft: A4V4, chip version: AB
2022-02-17 16:48:50:driver-btm-api.c:2164:get_calibration_voltage: calibration voltage flag is error data.
2022-02-17 16:48:50:driver-btm-api.c:486:check_chain_conf_same: Config are different, min = 1760, max = 1840,  diff is too large.
2022-02-17 16:48:50:auto_adapt.c:273:is_sweep_failed_before: open sweep tag failed
2022-02-17 16:48:50:driver-btm-api.c:247:set_miner_status: ERROR_SOC_INIT
----------------------------
เคสนี้ เกิดจาก การ์ดแตกต่างกันมากเกินไป ทำให้ จ่ายไฟต่างกันมากเกินไป โดยเฉพาะการ์ด 3 (ที่เพิ่มเข้าไป) Chain 2 มันใช้ชิป A4V4 ต่างจาก 2 การ์ดแรกที่ไม่เสีย คือ A3V1 


การใช้ PSU ผิด เช่น ใช้ APW9 กับรุ่น S17e หรือ T17+
--------------------
power_api.c:245:power_init: power type version error
--------------------
power_api คือ การสื่อสารกับ PSU ที่ผิดพลาด นั่นคือ อาจใช้รุ่นผิด