บทนำ
วิดีโอนี้นำเสนอผลงานของทีม Black Bean ผู้ชนะการแข่งขัน OpenAI to Z Challenge ที่จัดโดย OpenAI ซึ่งศึกษาแนวทางการใช้ปัญญาประดิษฐ์เพื่อผลักดันขอบเขตการค้นพบทางโบราณคดีในป่าฝนอะเมซอน ทีมงานพัฒนา Archaios ระบบที่สามารถสแกนและวิเคราะห์ข้อมูลสาธารณะอย่าง LiDAR และภาพถ่ายดาวเทียม ด้วยเทคนิค deep learning และผสานความสามารถของโมเดลภาษา OpenAI เพื่อเพิ่มชั้นของ "ความเข้าใจ" ให้กับผลลัพธ์ แผนงานของพวกเขาครอบคลุมตั้งแต่เตรียมข้อมูล การแบ่งพื้นที่เป็นไทล์ การฝึกโมเดล การประมวลผลหลังการทำนาย ไปจนถึงการสร้างเว็บไซต์โต้ตอบและรายงานเชิงวิชาการที่ช่วยให้นักโบราณคดีสามารถตรวจสอบจุดที่น่าสนใจได้อย่างมีประสิทธิภาพ

ภาพรวมแนวคิดและเป้าหมายของ Archaios
เป้าหมายหลักของ Archaios คือการสร้างระบบที่สามารถสแกนพื้นที่ขนาดใหญ่ของป่าฝนเพื่อค้นหา "ร่องรอย" หรือรูปทรงที่บ่งชี้ถึงกิจกรรมในอดีต เช่น earthworks (งานดิน) โครงสร้างที่มนุษย์เคยสร้าง หรือรูปแบบการใช้ที่ดิน ซึ่งมักถูกปกคลุมด้วยพืชพรรณหนาแน่นและยากต่อการมองเห็นจากภาพถ่ายปกติ
ทีมงานเชื่อว่าการรวมข้อมูล LiDAR กับภาพถ่ายดาวเทียม และการออกแบบกระบวนการวิเคราะห์เชิงลึกด้วย deep learning จะช่วยให้การค้นพบมีความแม่นยำและสามารถดำเนินการในระดับที่กว้างขวางได้อย่างมีประสิทธิภาพ ซึ่งหมายถึงการนำเทคโนโลยีมาช่วยลดเวลาและแรงงานที่ต้องใช้เมื่อเทียบกับการสำรวจด้วยตาเปล่าหรือการประเมินภาพแบบดั้งเดิม

ข้อมูลที่ใช้: LiDAR และภาพถ่ายดาวเทียม
ข้อมูล LiDAR (Light Detection and Ranging) มีความสำคัญอย่างยิ่งในงานนี้ เพราะสามารถเจาะทะลุชั้นพืชพรรณเพื่อเก็บข้อมูลโครงร่างพื้นดินที่ซ่อนอยู่ใต้ร่มเงา จุดเด่นของ LiDAR คือความสามารถแยกแยะระดับความสูงของพื้นผิวและโครงสร้างที่มนุษย์สร้างขึ้น ซึ่งเมื่อจับคู่กับภาพถ่ายดาวเทียมที่ให้บริบทเชิงภาพและสี ทีม Black Bean จึงสามารถฝังข้อมูลหลายชั้นให้กับโมเดล deep learning เพื่อให้มันเรียนรู้ลักษณะจำเพาะของไซต์โบราณคดี
ข้อมูลที่ใช้เป็นข้อมูลสาธารณะที่มีในหลายแหล่ง ทำให้วิธีการนี้มีศักยภาพที่จะขยายไปใช้กับพื้นที่อื่นๆ ได้หากข้อมูลพื้นฐานมีคุณภาพเพียงพอ

การแบ่งพื้นที่และสถาปัตยกรรมการวิเคราะห์
หนึ่งในองค์ประกอบสำคัญของกระบวนการคือการแบ่งพื้นที่ขนาดใหญ่เป็นไทล์ย่อยขนาด 3x3 กิโลเมตร สำหรับแต่ละไทล์ทีมงานคำนวณจุดศูนย์กลาง (centroid) แล้วนำข้อมูลจากบริเวณรอบ ๆ มาวิเคราะห์ซ้ำ ๆ เพื่อให้โมเดลสามารถจับลักษณะเชิงพื้นที่ได้ดีขึ้น การทำแบบนี้ช่วยให้ระบบมีแนวทางเป็นระเบียบในการสแกนพื้นที่และลดการตกหล่นของข้อมูลสำคัญที่อาจเกิดขึ้นถ้าสแกนแบบมุมมองกว้างเพียงครั้งเดียว
กระบวนการย่อยข้อมูลเป็นไทล์ยังเอื้อให้ปรับแต่งพารามิเตอร์ของโมเดลในระดับท้องถิ่นได้ เช่น ปรับความละเอียดของ LiDAR ปรับฟิลเตอร์ลดสัญญาณรบกวน หรือเปลี่ยนพารามิเตอร์ของขั้นตอนการแยกวิเคราะห์ เพื่อให้เหมาะสมกับความแตกต่างของภูมิประเทศหรือความหนาแน่นของพืชพรรณ

การฝึกสอนด้วย Deep Learning และการออกแบบตัวจำแนก
ทีม Black Bean เลือกใช้แนวทาง deep learning ในการฝึกตัวจำแนก (classifier) ที่เรียนรู้จากตัวอย่างของไซต์โบราณคดีที่รู้จักและตัวอย่างที่ไม่ใช่ไซต์ เพื่อให้โมเดลสามารถแยกแยะลักษณะเฉพาะของ earthworks และโครงร่างที่เป็นไปได้ โมเดลได้รับการฝึกจากข้อมูล LiDAR และภาพถ่ายดาวเทียมที่ถูกจัดเตรียมให้เป็นอินพุตหลายชั้น
ในการฝึกสอน ทีมงานให้ความสำคัญกับการลด noise และทำให้ฟีเจอร์ต่าง ๆ ชัดเจนขึ้นผ่านขั้นตอน preprocessing และการปรับค่าในกระบวนการทำงาน (configuration changes for the customizable workflow) หลังจากผ่านการประมวลผลเหล่านี้ โมเดลสามารถผลิตพื้นที่ที่มีคะแนนความน่าจะเป็นสูงสำหรับการเป็นไซต์โบราณคดีได้
ขั้นตอนการประมวลผลหลังการทำนาย (Post-processing)
ผลลัพธ์ดิบจากโมเดลมักประกอบด้วยการทำนายบนระดับพิกเซลหรือเซกเมนต์หลายจุด ทีมงานได้ออกแบบขั้นตอน post-processing เพื่อลด false positives เช่น การรวมกลุ่ม (clustering) ของจุดทำนาย การใช้เกณฑ์ความน่าเชื่อถือ (confidence thresholds) และการตรวจสอบรูปแบบเชิงพื้นที่ที่สอดคล้องกับการก่อสร้างหรือกิจกรรมของมนุษย์เมื่อเทียบกับพื้นหลังทางธรรมชาติ
การทำ post-processing ที่ดีช่วยให้ "สัญญาณ" ที่แท้จริงเด่นชัดขึ้น และลดจำนวนจุดที่ต้องตรวจสอบแบบแมนนวล ทำให้งานภาคสนามของนักโบราณคดีมีประสิทธิภาพมากขึ้น
ผลลัพธ์: รายการไซต์ที่มีศักยภาพและการยืนยันเชิงคุณภาพ
หลังจากผ่านขั้นตอนการประมวลผลทั้งหมด ทีม Black Bean ระบุว่ามี "ประมาณหนึ่งร้อยกว่าจุด" ที่เป็นไซต์ที่มีศักยภาพ ผลการวิเคราะห์เหล่านี้ถูกคัดกรองเพิ่มเติมผ่านการตรวจสอบด้วยตาและความรู้เชิงพื้นฐานด้านโบราณคดี ทีมพบว่าบางจุดมีลักษณะสอดคล้องกับสิ่งที่นักโบราณคดีคาดหวัง เช่น รูปทรงและการเรียงตัวของบ่งชี้การปรับสภาพพื้นที่ การมีลักษณะเป็นแนวเส้นหรือวงกลมที่ไม่เหมือนรูปแบบธรรมชาติ เป็นต้น
การยืนยันในขั้นต้นโดยการวิเคราะห์แมนนวลและการเปรียบเทียบกับตัวอย่างการศึกษาเชิงวิชาการบ่งชี้ว่ากระบวนการนี้ "มันทำงานได้" ในแง่ที่สามารถคัดกรองพื้นที่จำนวนมากเพื่อระบุจุดที่ควรได้รับการตรวจสอบเพิ่มเติมในภาคสนาม
การนำเสนอและการใช้งาน: เว็บไซต์โต้ตอบและรายงานสรุป
ทีมสร้างเว็บไซต์โต้ตอบที่แสดงผลแผนที่และรายการจุดที่โมเดลพิจารณาว่ามีศักยภาพ ผู้ใช้สามารถคลิกแต่ละจุดเพื่อดึงดูดรายละเอียด เช่น ภาพ LiDAR แบบซูม, ภาพดาวเทียม, คะแนนความน่าเชื่อถือ และคำสรุปเชิงอธิบายที่อธิบายว่าทำไมตำแหน่งนี้จึงถูกเลือก
สิ่งนี้ทำให้กระบวนการจากข้อมูลดิบถึงการตัดสินใจเชิงมนุษย์สั้นลง นักโบราณคดีสามารถใช้เว็บไซต์เป็นเครื่องมือในการวางแผนภาคสนามหรือการทำวิจัยเชิงลึกต่อไป

บทบาทของ OpenAI / GPT: จากเครื่องมือถามตอบสู่ผู้ร่วมงานเชิงความคิด
ทีม Black Bean ไม่ได้ใช้โมเดลภาษาเพียงเพื่อให้คำอธิบายพื้นฐาน แต่พวกเขาให้นิยามบทบาทของ GPT เป็น "ผู้ร่วมงาน" ที่ช่วยในหลายส่วนของกระบวนการทำงาน ตัวอย่างบทบาทที่ GPT ได้รับมอบหมายคือการสรุปรายละเอียดของแต่ละจุดอย่างลึกซึ้งและเขียนรายงานท้ายสุดโดย "แสร้งทำเป็นนักโบราณคดีที่มีประสบการณ์หลายปี"
"GPT based trail is done, and we told GPT to act as an archaeologist with years of experience and give a final report."
ทีมระบุว่า GPT ช่วยให้พวกเขา "ถกเถียง" ตัวเลือกต่าง ๆ วิเคราะห์ความแข็งแรงและจุดอ่อนของแนวทาง และเสนอขั้นตอนต่อไปในเชิงปฏิบัติ GPT ถูกใช้งานเป็นทั้งเครื่องมือช่วยตัดสินใจและเครื่องมือสรุปที่ช่วยแปลงผลทางเทคนิคให้เป็นข้อความที่เข้าใจง่ายและเหมาะสำหรับการนำเสนอต่อนักวิชาการหรือผู้มีส่วนได้ส่วนเสียอื่น ๆ

ข้อสังเกตเกี่ยวกับความสามารถของ LLM
ทีมงานย้ำว่าแม้ GPT จะไม่ใช่ "โมเดลที่ดีที่สุดสำหรับการดึงฟีเจอร์จากภาพ" แต่คุณสมบัติที่โดดเด่นของมันคือการสรุปข้อมูลและการจัดระเบียบความคิดได้อย่างรวดเร็ว พวกเขาใช้ GPT ในการแปลงข้อมูลเชิงเทคนิคเป็นคำอธิบายที่สื่อสารได้ง่าย ซึ่งเป็นประโยชน์เมื่อทำงานร่วมกับนักโบราณคดีที่ต้องการบริบทและเหตุผลประกอบการเลือกจุดที่ควรสำรวจ
"I think this is more like a collaborator... For each point, he will give me several ways for me to choose."
นอกจากนี้ GPT ช่วยเร่งกระบวนการเรียนรู้ของทีมที่บางคนไม่มีพื้นฐานด้านโบราณคดี โดย GPT ให้คำอธิบายเชิงพื้นฐานและคำแนะนำเพื่อให้ทีมสามารถตัดสินใจเชิงเทคนิคได้ดียิ่งขึ้นในเวลาสั้น ๆ
ช่วงเวลาที่ทำให้ทีมรู้สึกตื่นเต้น (Wow Moment)
หนึ่งในช่วงเวลาที่ทำให้ทีมรู้สึก "ว้าว" คือเวลาที่พวกเขาเห็นผลลัพธ์สุดท้ายหลังการประมวลผล และเมื่อนำไปตรวจสอบด้วยสายตาพบว่าจุดบางจุดมีลักษณะที่เข้ากับความคาดหมายเชิงโบราณคดี แม้ทีมจะมีความรู้เชิงโบราณคดีที่ตื้น แต่การตรวจพบความสอดคล้องนี้เป็นสัญญาณชัดเจนว่ากระบวนการเรียนรู้ของโมเดลได้เรียนรู้ลักษณะเฉพาะจากข้อมูลฝึกจริง
ประสบการณ์การแข่งขันและนิยามทีม Black Bean
ทีม Black Bean ประกอบด้วยสมาชิกสามคน ได้แก่ Yao, Yingjie และ YuJa โดยทุกคนมีพื้นหลังด้านวิศวกรรมซอฟต์แวร์หรือการเรียนรู้เชิงลึก สมาชิกหนึ่งในทีมเล่าว่าพวกเขาพบการประกวดผ่านแพลตฟอร์มที่นักวิทยาศาสตร์ข้อมูลคุ้นเคย เช่น Kaggle และใช้ช่วงเวลาว่างของตนในการร่วมโครงการนี้
ที่มาของชื่อทีม "Black Bean" มาจากสุนัขประจำบ้านของครอบครัวที่มีชื่อว่า Black Bean ซึ่งเสียชีวิตเมื่อไม่กี่เดือนก่อนเมื่อมีอายุได้สิบหกปี ทีมเลือกชื่อนี้เพื่อระลึกถึงและเป็นเกียรติแด่สมาชิกในครอบครัว

คำแนะนำจากทีมสำหรับการใช้ LLM ในงานวิจัยและการค้นพบ
จากประสบการณ์ ทีมให้คำแนะนำสำหรับผู้ที่ต้องการนำ LLM มาใช้ในการวิจัยเชิงค้นพบดังนี้:
- มองว่า LLM เป็น "ผู้ร่วมงาน" มากกว่าเป็นเพียง chatbot ให้ใช้เพื่อสรุป วิเคราะห์ทางความคิด และเสนอทางเลือกต่าง ๆ ในกระบวนการวิจัย
- ใช้ LLM เพื่อเร่งการเรียนรู้เชิงโดเมน: หากทีมไม่มีพื้นฐานด้านสาขานั้น ๆ LLM สามารถย่นระยะเวลาเรียนรู้พื้นฐานและแนะนำคำศัพท์หรือแนวปฏิบัติที่จำเป็นได้
- ใช้ LLM ในการสื่อสารผลลัพธ์: การแปลงผลเชิงเทคนิคเป็นข้อความที่เข้าใจง่ายช่วยให้การทำงานร่วมกับนักวิชาการหรือผู้มีส่วนได้ส่วนเสียเป็นไปอย่างราบรื่น
- รู้ข้อจำกัด: LLM อาจไม่ใช่เครื่องมือที่เหมาะสำหรับการดึงฟีเจอร์จากภาพโดยตรง ควรผสานโมเดลภาพเฉพาะทางร่วมกับ LLM เพื่อได้ผลลัพธ์ที่ดีที่สุด
การทำงานร่วมกับชุมชนวิชาการและแผนการในอนาคต
ทีมให้ความสำคัญกับการเปิดเผยงานวิจัยและการรับฟังความคิดเห็นจากชุมชนโบราณคดี พวกเขาวางแผนที่จะเผยแพร่รายละเอียดของกระบวนการ งานเขียน และผลลัพธ์เบื้องต้นผ่านช่องทางที่สามารถเข้าถึงได้เพื่อรับคำติชมและแรงบันดาลใจจากนักวิชาการทั่วโลก
เป้าหมายในระยะยาวรวมถึงการปรับปรุงโมเดลให้แม่นยำยิ่งขึ้น การรวมข้อมูลจากพื้นที่อื่นๆ และการร่วมมือกับโครงการ LiDAR ขนาดใหญ่เพื่อขยายขอบเขตการสแกน นอกจากนี้ยังมีแนวคิดที่จะให้นักโบราณคดีภาคสนามและชุมชนท้องถิ่นมีส่วนร่วมในการตรวจสอบและยืนยันผลลัพธ์ เพื่อให้การค้นพบมีความรับผิดชอบและเชื่อถือได้
ข้อจำกัด จริยธรรม และพื้นที่ที่ต้องปรับปรุง
แม้ผลการทดลองจะมีความหวัง แต่ทีมก็ยอมรับว่ามีข้อจำกัดที่ต้องพิจารณาอย่างรอบคอบ:
- ความจำเป็นในการยืนยันภาคสนาม: ผลจากโมเดลเป็นการคัดกรองจุดที่ "น่าจะเป็นไปได้" แต่การยืนยันเชิงวิชาการยังต้องการการตรวจสอบภาคสนามของผู้เชี่ยวชาญ
- คุณภาพของข้อมูลอินพุต: ประสิทธิภาพของโมเดลพึ่งพาคุณภาพและความครอบคลุมของข้อมูล LiDAR และภาพดาวเทียม หากข้อมูลมีช่องว่างหรือไม่มีการเก็บข้อมูลบางพื้นที่ การค้นพบจะจำกัด
- ความเสี่ยงเรื่องสิทธิชุมชนและความเป็นส่วนตัว: การเผยแพร่ตำแหน่งที่เป็นไปได้ของไซต์โบราณคดีอาจส่งผลกระทบต่อชุมชนท้องถิ่นหรือทำให้แหล่งโบราณคดีเสี่ยงต่อการลักลอบขุดค้นโดยไม่ได้รับอนุญาต ดังนั้นการเปิดเผยข้อมูลต้องพิจารณาด้านจริยธรรมและมีกระบวนการตรวจสอบร่วมกับหน่วยงานที่เกี่ยวข้อง
- ข้อจำกัดของ LLM ในการตีความภาพ: ควรใช้โมเดลคอมพิวเตอร์วิทัศน์ (computer vision) ที่เชี่ยวชาญร่วมกับ LLM เพื่อให้ได้ผลลัพธ์ที่สมบูรณ์
เหตุผลที่แนวทางนี้มีความหมายต่อโบราณคดีสมัยใหม่
การผสาน AI เข้ากับโบราณคดีไม่ใช่เพียงเรื่องของเทคโนโลยี แต่เป็นการเปิดช่องทางใหม่ในการสำรวจอดีต เทคนิคเช่นที่ทีม Black Bean นำเสนอสามารถ:
- ขยายการสำรวจไปยังพื้นที่กว้างใหญ่ที่ยากต่อการเข้าถึง
- ลดเวลาที่ต้องใช้สำหรับการคัดกรองพื้นที่ก่อนการลงภาคสนาม
- เพิ่มความเป็นไปได้ในการค้นพบรูปแบบที่ไม่ชัดเจนต่อสายตามนุษย์
- ช่วยรักษาแหล่งข้อมูลและบันทึกการค้นพบให้เป็นระบบและสามารถติดตามได้
ทั้งนี้ แนวทางต้องควบคู่ไปกับหลักการทางวิชาการและการทำงานร่วมกับชุมชนท้องถิ่นเพื่อให้การค้นพบมีความรับผิดชอบและเป็นประโยชน์ต่อสังคม

บทสรุป
ทีม Black Bean แสดงให้เห็นว่าเทคโนโลยีสมัยใหม่ เช่น LiDAR, deep learning และโมเดลภาษาอย่าง GPT สามารถร่วมกันขับเคลื่อนการค้นพบทางโบราณคดีให้เป็นไปได้ในระดับที่ไม่เคยมีมาก่อน Archaios เป็นตัวอย่างของระบบที่ออกแบบมาให้สามารถสแกนพื้นที่กว้าง วิเคราะห์ข้อมูลเชิงลึก และนำเสนอผลลัพธ์ในรูปแบบที่นักวิชาการและผู้มีส่วนได้ส่วนเสียสามารถใช้งานได้จริง
ความสำเร็จของพวกเขาไม่ได้หมายความว่าปัญหาทั้งหมดได้รับการแก้ไข แต่เป็นสัญญาณชัดเจนว่าการผสมผสาน AI กับความเชี่ยวชาญทางสหวิทยาการสามารถสร้างเครื่องมือที่ช่วยนักวิจัยค้นพบอดีตได้รวดเร็วและมีประสิทธิภาพยิ่งขึ้น ทีมเสนอให้เผยแพร่ผลงานและร่วมมือกับชุมชนวิชาการเพื่อรับฟังคำติชม ปรับปรุงเทคนิค และขยายขอบเขตการนำไปใช้ในอนาคต
สุดท้าย ทีม Black Bean ขอบคุณผู้สนับสนุน ทุกคนที่เกี่ยวข้อง รวมทั้งผู้จัดงานและคณะกรรมการตัดสิน และแสดงความมุ่งมั่นที่จะพัฒนางานนี้ต่อไปเพื่อให้เป็นประโยชน์ต่อการศึกษาประวัติศาสตร์มนุษย์ในบริบทที่กว้างขึ้น