Mona Lisa ขมวดคิ้ว: การเรียนรู้ของเครื่องนำภาพวาดและภาพถ่ายเก่า ๆ มาใช้ชีวิต — OPDEV.MEN

Mona Lisa ขมวดคิ้ว: การเรียนรู้ของเครื่องนำภาพวาดและภาพถ่ายเก่า ๆ มาใช้ชีวิต thumbnail

นักวิจัยการเรียนรู้ด้วยเครื่องจักรได้สร้างระบบที่สามารถสร้างการเคลื่อนไหวที่เหมือนจริงได้จากเพียงใบหน้าเดียวของใบหน้าซึ่งเปิดโอกาสให้แอนิเมชั่นไม่เพียงแค่ภาพถ่าย แต่ยังรวมถึงภาพวาด มันไม่สมบูรณ์แบบ แต่เมื่อมันได้ผลมันก็เหมือนงาน AI ที่สมัยนี้น่าทึ่งและน่าหลงใหล แบบจำลองนี้จัดทำขึ้นในเอกสารเผยแพร่โดย Samsung AI Center ซึ่งคุณสามารถอ่านได้ที่นี่ใน Arxiv เป็นวิธีการใหม่ในการใช้จุดสังเกตใบหน้าบนใบหน้าต้นทาง – หัวการพูดใด ๆ จะทำ – กับข้อมูลใบหน้าของใบหน้าเป้าหมายทำให้ใบหน้าเป้าหมายทำในสิ่งที่ใบหน้าต้นทางทำ สิ่งนี้ไม่ใช่เรื่องใหม่ – เป็นส่วนหนึ่งของปัญหาสังเคราะห์ภาพทั้งหมดที่เผชิญหน้ากับโลก AI ในขณะนี้ (เราได้มีการพูดคุยที่น่าสนใจเกี่ยวกับเรื่องนี้เมื่อเร็ว ๆ นี้ที่งาน Robotics AI ของเราในเบิร์กลีย์) เราสามารถสร้างหน้าในวิดีโอหนึ่งให้เห็นหน้ากันในแง่ของสิ่งที่คนพูดหรือที่พวกเขากำลังมองหา แต่โมเดลเหล่านี้ส่วนใหญ่ต้องการข้อมูลจำนวนมากเช่นวิดีโอหนึ่งนาทีหรือสองนาทีเพื่อวิเคราะห์ อย่างไรก็ตามบทความใหม่โดยนักวิจัยจากมอสโคว์ของซัมซุงแสดงให้เห็นว่าการใช้ใบหน้าเพียงใบหน้าเดียวของบุคคลนั้นสามารถสร้างวิดีโอขึ้นมาได้เมื่อใบหน้านั้นพูดและแสดงความรู้สึกธรรมดา – ด้วยความมั่นใจแม้จะห่างไกลจากความไร้ที่ติ มันทำเช่นนี้โดยการถ่ายภาพกระบวนการระบุสถานที่สำคัญด้วยข้อมูลจำนวนมากทำให้โมเดลมีประสิทธิภาพสูงในการค้นหาชิ้นส่วนของใบหน้าเป้าหมายที่สอดคล้องกับแหล่งที่มา ยิ่งมีข้อมูลมากเท่าไหร่ก็ยิ่งดีเท่านั้น แต่สามารถทำได้ด้วยภาพเดียว – เรียกว่าการเรียนรู้ด้วยการถ่ายภาพเดี่ยวและหนีไปกับมัน นั่นคือสิ่งที่ทำให้สามารถถ่ายรูปไอน์สไตน์หรือมาริลีนมอนโรหรือแม้แต่โมนาลิซ่าและทำให้มันเคลื่อนไหวและพูดเหมือนคนจริง ในตัวอย่างนี้ Mona Lisa เป็นภาพเคลื่อนไหวโดยใช้วิดีโอต้นฉบับสามรายการซึ่งคุณสามารถเห็นผลลัพธ์ที่แตกต่างกันมากทั้งในโครงสร้างใบหน้าและพฤติกรรม นอกจากนี้ยังใช้สิ่งที่เรียกว่า Generative Adversarial Network ซึ่งโดยหลักแล้วจะทำการจำลองสองแบบต่อกันอีกอันหนึ่งพยายามที่จะหลอกให้คนอื่นคิดว่าสิ่งที่สร้างนั้นเป็น“ ของจริง” โดยผลลัพธ์เหล่านี้จะได้ผลลัพธ์ที่ตรงตามความจริงในระดับหนึ่ง – โมเดล“ discriminator” ต้องพูด 90% ว่าเป็นใบหน้ามนุษย์เพื่อให้กระบวนการดำเนินการต่อ ในตัวอย่างอื่น ๆ ที่จัดทำโดยนักวิจัยคุณภาพและความชัดเจนของหัวพูดปลอมนั้นแตกต่างกันอย่างกว้างขวาง บางคนที่พยายามจะทำซ้ำคนที่มีภาพถูกนำมาจากข่าวเคเบิลก็สร้างตัวเลือกข่าวที่ด้านล่างของภาพอีกครั้งเติมด้วยความพูดพล่อยๆ และสิ่งสกปรกตามปกติและสิ่งแปลก ๆ นั้นอยู่ทั่วไปทุกหนทุกแห่งถ้าคุณรู้ว่าจะต้องหาอะไร ที่กล่าวมามันน่าทึ่งว่ามันทำงานได้ดีเหมือนกัน อย่างไรก็ตามโปรดทราบว่าวิธีนี้ใช้ได้กับใบหน้าและลำตัวส่วนบนเท่านั้น – คุณไม่สามารถทำให้ Mona Lisa จับนิ้วมือหรือเต้นรำได้ ยังไม่ได้
ดูข้อมูลเพิ่มเติม จากแหล่งเว็บไซต์ข่าว

Facebook Comments