Google ซุ่มพัฒนา ‘Apprentice Bard’ แชทบอตสู้ศึก ChatGPT

จับตามอง ‘Apprentice Bard (แอพเพรนทิส บาร์ด)’ แชทบอตตอบคำถามอัจฉริยะจากกูเกิล ที่มีการทำงานใกล้เคียงกับ ChatGPT ของบริษัท Open AI
หลังจากการเรียกประชุมทีมโปรแกรมเมอร์ของบริษัทกูเกิล

ข่าว ทั่วทั้งโลกต่างจับตามองว่า ผลิตภัณฑ์ไหนที่จะมา “สยบ” ความฉลาดของแชทบอตอัจฉริยะอย่าง ChatGPT ได้ ยักษ์ใหญ่เทคโนโลยีใครจะเป็นคนส่งอาวุธใหม่ลงสนาม ทางสำนักข่าว CNBC รายงานความคืบหน้าว่า กูเกิลกำลังพัฒนาแชทบอตที่ทำงานคล้ายกับ ChatGPT ในชื่อ “Apprentice Bard (แอพเพรนทิส บาร์ด)” แชทบอตตอบคำถามอย่างเป็นธรรมชาติและเหมือนมนุษย์ ซึ่งกูเกิลได้ขอให้พนักงานทดลองใช้ระบบดังกล่าว โดยเข้าไปพูดคุย ซักถาม บนกล่องสนทนาอย่างที่ ChatGPT ทำ จากนั้นก็รับฟีดแบคมาปรับปรุงการทำงานของแชทบอต ซึ่งภายหลังสัปดาห์ที่เริ่มทดสอบ แชทบอตมีความก้าวหน้าอย่างก้าวกระโดด Apprentice Bard ใช้เทคโนโลยีของ LaMDA หรือ Language Model for Dialogue Applications ซึ่งเข้ามาแทนที่ Meena สมาร์ตแชทบอตรุ่นก่อนหน้าที่เปิดตัวเงียบ ๆ ภายใน แต่ถูกยกเลิกในภายหลัง

Google ซุ่มพัฒนา ‘Apprentice Bard’

ผู้ใช้รายหนึ่งถามแชทบอตว่า “กูเกิลจะมีการปลดพนักงานเพิ่มในปี 2023 หรือไม่” ซึ่งทางแชทบอตตอบว่า สำหรับปี 2023 นี้ กูเกิลไม่น่าจะปลดพนักงานเพิ่มอีก เนื่องจากบริษัทบริหารต้นทุนต่าง ๆ ได้ดี

รายได้เพิ่มขึ้น 34% ในปี 2021 และราคาหุ้นของบริษัทเพิ่มขึ้น 70% ตั้งแต่เดือนมกราคม 2022 ดูเหมือนว่า กูเกิลจะหาจุดได้เปรียบเจอแล้ว เพราะสิ่งที่ ChatGPT ทำไม่ได้ คือการให้คำตอบที่เป็นปัจจุบัน ฐานข้อมูลของ GPT เป็นเรื่องราวที่เกิดขึ้นหลังปี 2021 เท่านั้น เจฟฟ์ ดีน หัวหน้าฝ่ายเอไอของกูเกิล กล่าวว่า เนื่องจากบริษัททำธุรกิจเกี่ยวกับการค้นหามานาน และค่อนข้างที่จะมีชื่อเสียง ข่าวเทคโนโลยี หากคำตอบจากแชทบอตเป็นข้อมูลที่ผิดพลาดก็จะทำให้ความน่าเชื่อถือลดน้อยลง พวกเขาพูดหยอกล้อกันว่า “อาจจะต้องระวังข้อผิดพลาดมากกว่าสตาร์ตอัปเล็ก ๆ” นอกจากนี้ โฆษกของกูเกิลยังย้ำไว้อีกว่า “เรามุ่งเน้นการพัฒนาเอไอ เพื่อการปรับใช้ในชีวิตของผู้คนมานานแล้ว เพราะเอไอเป็นเทคโนโลยีที่มีประโยชน์สำหรับบุคคล ธุรกิจ และชุมชน ดังนั้น การจะพัฒนาผลิตภัณฑ์อะไรก็ตามแต่ เราจำเป็นต้องพิจารณาถึงผลกระทบทางสังคมในวงกว้าง การทดสอบแค่ภายในก็เพื่อให้แน่ใจว่ามีประโยชน์และปลอดภัย และหวังว่านวัตกรรมที่เราทำจะออกสู่สาธารณะชนได้ในเร็ว ๆ นี้”

“โกวาจี” AI ฟัง-แปลงเสียงข้อความใช้คัดกรองผู้ป่วยซึมเศร้า

จุฬาฯ ออกแบบ “โกวาจี (Gowajee)” AI แปลงเสียงเป็นข้อความ-แปลงข้อความเป็นเสียง มีความแม่นยำเป็นธรรมชาติ เริ่มใช้งานแล้วกับระบบคอลเซ็นเตอร์และการคัดกรองผู้ป่วยซึมเศร้า จ่อประยุกต์ใช้กับงานอีกหลายรูปแบบ
‘OK, Google’

เทคโนโลยี  ทุกวันนี้เราเริ่มคุ้นชินกับการใช้เสียงออกคำสั่งหรือบอกให้โปรแกรม AI อย่าง Google หรือ Siri ค้นหาหรือทำงานตามที่เราต้องการแทนการสัมผัสแป้นพิมพ์อักษร แต่เคยรู้สึกไหมว่า AI voice เหล่านั้นดูเหมือนจะไม่ค่อยเข้าใจโทนเสียงภาษาไทยที่เราพูดนักหลายครั้งก็แปลงเสียงเป็นข้อความที่ไม่ตรง ทำให้เราต้องปรับการออกเสียงภาษาไทยเพื่อให้เข้ากับ AI ที่พัฒนามาจากบริษัทต่างชาติ ซึ่งเน้นการใช้งานกับหลายภาษาโดยเฉพาะภาษาสากล เช่น ภาษาอังกฤษจากปัญหาดังกล่าว ดร.เอกพล ช่วงสุวนิช อาจารย์ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัยและทีม ได้พัฒนา AI สัญชาติไทยแท้ “Gowajee” (อ่านว่า โก-วาจี) ที่เข้าใจภาษาไทยโดยเฉพาะเพื่อตอบโจทย์การถอดความภาษาไทยที่แม่นยำและเป็นธรรมชาติมากขึ้น พิสูจน์ผ่านการใช้งานจริงแล้วว่ามีข้อผิดพลาดทางภาษาเพียง 9% เท่านั้นเมื่อเทียบกับ AI ถอดความอื่นๆ ที่มีความผิดพลาดราว 15%“โกวาจี” AI ฟัง-แปลงเสียงข้อความใช้คัดกรองผู้ป่วยซึมเศร้าAI ภาษาไทยด้วยฐานข้อมูลเสียงของคนไทยจากความตั้งใจสร้าง AI แปลงเสียงและข้อความสัญชาติไทย อาจารย์เอกพลและทีมงานได้เริ่มเก็บฐานข้อมูลเสียงภาษาไทยมาตั้งแต่ปี 2560 จนปัจจุบัน“เราเก็บข้อมูลเสียงภาษาไทยหลายรูปแบบและวิธีการ มีทั้งเปิดเว็บไซต์ให้คนเข้ามาอ่านข้อความเพื่อเก็บฐานข้อมูลเสียง จ้างคนมานั่งสนทนากัน หรือจ้างนักแสดงมาพูดสื่อสารอารมณ์ ทั้งหมดรวมแล้วกว่า 5,000 ชั่วโมง จนมั่นใจว่าเรามีข้อมูลมากเพียงพอในการถอดความภาษาไทยได้อย่างแม่นยำ” อ.เอกพล กล่าวฐานข้อมูลเสียงภาษาไทยจำนวนมากดังกล่าวช่วยให้ทีม Gowajee พัฒนานวัตกรรม AI ภาษาไทยที่มีความแม่นยำในภาษา และสามารถประยุกต์ใช้งานได้ 3 ลักษณะสำคัญ ได้แก่1. Automated Speech Recognition (ASR) เป็นการทำงานในลักษณะของการถอดความ คือ เมื่อเราพูดอะไรลงไป โปรแกรมก็จะแปลงสิ่งที่เราพูดให้ออกมาเป็นข้อความ“ยกตัวอย่างการใช้งานในการเรียนรู้ เวลาเราฟังเลคเชอร์ หากเราบันทึกเสียงอาจารย์เอาไว้ โปรแกรมก็จะช่วยถอดความออกมาเป็นตัวหนังสือให้เราอ่านได้เลยโดยไม่ต้องไปถอดความเอง” อ.เอกพล แนะ2. Text-to-Speech (TTS) เป็นการทำงานในลักษณะของการแปลงข้อความให้เป็นเสียงพูด อย่างที่เราคุ้นเคยกับการใช้ Google หรือ Siri ในการช่วยอ่านข้อความ แต่เสียงอ่านที่พัฒนาขึ้นโดยโมเดลของ Gowajee จะมีความเป็นธรรมชาติมากกว่า เนื่องจากมีฐานข้อมูลภาษาไทยจำนวนมากกว่านั่นเอง3. Automatic Speaker Verification (ASV) เป็นการยืนยันตัวตนผู้พูดด้วยเสียง ซึ่งสามารถนำมาใช้เพื่อยืนยันตัวตนในการติดต่อกับคอลเซ็นเตอร์ หรือนำมาใช้เพื่อบ่งบอกว่าใครพูดเมื่อใด

โกวาจี AI ฟัง-แปลงเสียงข้อความใช้คัดกรองผู้ป่วยซึมเศร้า

“โกวาจี” AI ฟัง-แปลงเสียงข้อความใช้คัดกรองผู้ป่วยซึมเศร้าตอบโจทย์ระบบคอลเซ็นเตอร์

นับตั้งแต่ที่เริ่มพัฒนา Gowajee ก็มีหน่วยงานต่างๆ ทั้งมหาวิทยาลัย ภาครัฐ และเอกชน นำเทคโนโลยีนี้ไปใช้แล้ว โดยเฉพาะในงานการให้บริการคอลเซ็นเตอร์ ทั้งถอดเสียงเป็นข้อความ และถอดข้อความเป็นเสียง“ที่ผ่านมา ลูกค้าส่วนมากมีความพึงพอใจในความถูกต้องของ Gowajee ที่ดีกว่าของเดิมที่เคยใช้ และในแง่ราคา ก็จับต้องได้มากกว่า ในส่วนของข้อผิดพลาด เรามั่นใจว่าต่อไป เมื่อระบบมีข้อมูลเพิ่มมากขึ้นเรื่อยๆ ความผิดพลาดที่มีอยู่ในปัจจุบันจะลดลงเรื่อยๆ”ค้นความหมายในเสียง Gowajee ช่วยคัดกรองผู้ป่วยซึมเศร้าจากการเก็บข้อมูลเสียงที่สื่ออารมณ์ต่างๆ ทีม Gowajee ได้เข้าไปมีสวนช่วยพัฒนาระบบของแอปพลิเคชัน DMIND ที่ทำหน้าที่ช่วยคัดกรองผู้ป่วยโรคซึมเศร้า ซึ่งเป็นอีกหนึ่งนวัตกรรมช่วยเหลือสังคมของจุฬาฯ“DMIND เป็นโจทย์ที่ท้าทายเพราะนอกจากจะต้องถอดความแล้ว ยังต้องใช้โมเดลจำแนกอารมณ์จากเสียงพูดเพื่อนำไปวิเคราะห์หาความหมายของกลุ่มเสี่ยงอีกด้วย บางครั้ง ผู้ป่วยจะพูดไปร้องไห้ไป ซึ่งทำให้ฟังยากขึ้น แต่ Gowajee ก็ทำงานได้ค่อนข้างดี เราอาจไม่จำเป็นต้องถอดความให้ถูกต้องทุกคำ แต่จับคำสำคัญให้ได้เพื่อถอดความสำคัญออกมา”Gowajee ประยุกต์ช่วยงานอะไรได้อีกบ้างowajee และเทคโนโลยี AI ถอดความภาษายังสามารถประยุกต์ใช้ในพื้นที่ชีวิตและการทำงานได้หลากหลาย อาทิ เป็นผู้ช่วยทันตแพทย์ในการจดบันทึกข้อมูลคนไข้ ระหว่างที่ทันตแพทย์กำลังใช้เครื่องมือทำฟันให้คนไข้ ก็พูดบอกสิ่งที่ต้องการบันทึกให้ Gowajee แปลเป็นข้อความช่วยตรวจหาความเสี่ยงของผู้ป่วยที่อาจมีภาวะ stroke เมื่อเริ่มพูดไม่ชัดช่วยเป็น Coach ตั้งคำถามให้ผู้ใช้งานตอบและวิเคราะห์เป้าหมายในการใช้ชีวิตจากการบันทึกการสัมภาษณ์ทางวีดิโอ เป็นส่วนที่ใช้ในการแนะแนวนักศึกษาหรือสำหรับองค์กรที่กำลังรับคนเข้าทำงานช่วยแปลงเสียงและขยายเสียงพูดให้ผู้สูงอายุสามารถได้ยินเสียงได้ชัดเจนยิ่งขึ้น นอกจากนี้ หลายคนอาจคิดถึงการประยุกต์ใช้ Gowajee กับการเรียนและการประชุม ในการแปลงข้อมูลเสียงเป็นข้อความ เป็นต้นข้อมูลปลอดภัย มั่นใจ Gowajee“ความปลอดภัยของข้อมูล” คือจุดเด่นของ Gowajee ที่เหนือกว่า AI ถอดความอื่นๆ อ.เอกพล กล่าวให้ความมั่นใจว่า “โดยปกติแล้ว เวลาเราใช้โปรแกรมถอดความของเจ้าอื่นๆ ข้อมูลจะถูกเก็บไว้บนคลาวด์ (cloud) หรือทำการประมวลผลข้อมูลที่คอมพิวเตอร์ของผู้ให้บริการแต่สำหรับ Gowajee ข้อมูลเหล่านี้จะถูกเก็บอยู่ในฐานข้อมูลของผู้ใช้เอง ซึ่งข้อมูลของผู้ใช้ ข่าวเทคโนโลยี  โดยเฉพาะธนาคารที่ต้องการความปลอดภัยของข้อมูล ก็จะไม่หลุดออกไปภายนอกแน่นอน”“AI ไม่ได้ disrupt เราขนาดนั้น ตัวเราเองต่างหากที่ disrupt ตัวเองมากกว่า สังคมสูงวัย ปัญหาประชากรวัยแรงงานขาดแคลน เหล่านี้ต่างหากกำลังบีบเราให้ต้องสร้างเทคโนโลยีเพื่อทุ่นแรงและทดแทนงานบางอย่างที่อนาคตเราอาจจะหาคนมาทำไม่ได้ ผมไม่ได้คาดหวังว่างานของผมจะช่วยเหลือผู้สูงอายุในปัจจุบัน แต่ผมมองว่าในอนาคต ตัวผมเองจะกลายเป็นผู้สูงอายุ ผมคงจะได้ใช้งานเทคโนโลยีเหล่านี้”

แนะนำข่าวเทคโนโลยี  อ่านเพิ่มเติมคลิ๊กเลย : Adobe เปิดตัว Photoshop Elements 2023 และ Premiere Elements 2023 เพื่อมือใหม่โดยเฉพาะ

Adobe เปิดตัว Photoshop Elements 2023 และ Premiere Elements 2023 เพื่อมือใหม่โดยเฉพาะ

Adobe ได้เผยโฉม Photoshop Elements แล้วก็ Premiere Elements เวอร์ชั่นใหม่รับปี 2023

คุณลักษณะเด่นที่ย้ำความเร็วรวมทั้งง่ายทั้งยังการปรับปรุงภาพนิ่งและก็วิดีโอ ดังนี้โปรแกรมชุดนี้เป็นแบบซื้อต้องมีให้ได้ร่วมกับ Creative Cloud อะไร

ลักษณะเด่นที่ชุดเจนเป็นการนำ Adobe Sensei AI มาใช้งานเกี่ยวกับการปรับปรุงแก้ไขภาพการจัดแต่งเองของภาพ Animation และก็ปฏิบัติงานเจริญระหว่าง Photoshop ที่เป็นโปรแกรมแต่งภาพ และก็ Premiere โปรแกรมปรับปรุงวิดีโอ โดยมีต้นแบบที่ช่วยสำหรับการปรับปรุงที่ไวมากยิ่งขึ้นถึง 90 แบบอย่าง และก็ยังมีการบอกชี้แนะว่าควรปรับแก้แบบไหน

เทคโนโลยี่

ความง่ายของโปรแกรมนี้ทำเป็นใกล้เคียงกับ Lightroom, Photoshop แล้วก็ Premiere Pro อย่างเช่นการปรับปรุงสีสันต่างๆและก็ยังช่วยใส่ Effect กล้วยๆได้อัตโนมัติ พร้อมทั้งแก้ไขคุณภาพการทำงานให้ไวขึ้น 50% และก็มีขนาดโปรแกรมที่เล็กลง แล้วก็ยังรองรับกับชิป M1 ของ Apple สถานที่สำหรับทำงานได้มีคุณภาพสูงสุด 70% ดำเนินงานได้อีกทั้งแบบ Apps แล้วก็ Web Browser เช่นกัน

สำหรับราคานั้น ซื้อเป็น Pack เดียวราคา 99.99 ดอลล่าร์สหรัฐอเมริกา ส่วนถ้าหากซื้อเป็นคู่จะราคาแพง 149.99 ดอลล่าร์สหรัฐอเมริกา ดังนี้เริ่มวางขายที่อเมริกาก่อน