Trending News

Subscribe Now

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

ถ้าคุณเข้าใจว่าระบบสั่งการด้วยเสียงคือล้ำแล้ว คุณกำลังตกยุค

Article | Creative/Design | Technology

“Hey Google, play some music”

เชื่อว่าสายเทคโนโลยีหลายคนน่าจะได้มีโอกาสลองใช้การส่งคำสั่งด้วยเสียงกันแล้ว ไม่ว่าจะผ่านอุปกรณ์อย่าง Google Home หรือ Amazon Alexa หรือจากมือถืออย่าง Siri ใน iPhone หรือ Google Assistant ใน Android

สิ่งที่นักพัฒนาพยายามทำอยู่ในปัจจุบันคือการพยายามทำให้เจ้าเครื่องเหล่านี้สามารถฟังเสียงของเราได้แม่นยำชัดเจนมากขึ้น แน่นอนว่าบางครั้งเราพูดสำเนียงไม่ดี หรือแม้แต่สั่งขณะที่มีอาหารอยู่ในปาก เจ้าระบบเหล่านี้นอกจากจะต้องพยายามเข้าใจแล้ว ยังต้องเรียนรู้สำเนียง โทนเสียง หรือแม้แต่รูปแบบคำสั่งของเราเพิ่มขึ้นทุกวัน ๆ อีกด้วย

ความพยายามอีกขั้นหนึ่งคือการจดจำน้ำเสียงแน่นอนว่าเสียงของแต่ละคนนั้นไม่เหมือนกัน มนุษย์เราเองสามารถจำเสียงของเพื่อนที่ตะโกนดังมาจากนอกบ้านได้โดยไม่ต้องเห็นตัว ซึ่งการพัฒนาด้าน Voice Recognition นั้น อาจจะพาเราไปสู่ยุคที่ไม่เพียงแต่ใช้เสียงส่งคำสั่งแต่ยังสามารถใช้เสียงปลดล็อคพาสเวิร์ดได้เลย

เพราะถ้าระบบสามารถจำได้ว่านี่คือเสียงของเราแล้ว เราก็สามารถสั่งให้ระบบโอนเงิน ถอนเงินได้ โดยไม่ต้องใส่รหัสผ่าน หรือพาสเวิร์ดใด ๆ

แต่นั่นก็ยังไม่ใช่เรื่องที่ใหม่ซะทีเดียว

ล่าสุด COCHLEAR (http://cochlear.ai) Startup รายหนึ่งของญี่ปุ่นได้คิดระบบที่สามารถฟังเสียงได้มากกว่า voice หรือเสียงพูดได้แล้ว

เสียงอะไรอีก นอกจากเสียงพูด?

เสียงฝนตก เสียงเดินเท้า เสียงนกร้อง

มนุษย์เรามีความสามารถในการฟังเสียงเหล่านี้ แต่ระบบ voice recognition ในปัจจุบันยังไปไม่ถึงจุดนั้น

Yoonchang Han, CEO และ Co-founder ของ Cochlear บอกว่า ในอนาคตพวกเขามีความพยายามอยากให้ระบบสามารถพัฒนาไปให้ถึงการสามารถแยกแยะได้ระหว่างเสียงฝนตกหนัก ฝนตกเบา เสียงเท้าเดิน ที่สามารถรู้ได้ว่า การเดินหนักเช่นนี้ ความถี่แบบนี้ คือการเดินของใคร หรือแม้แต่เสียงร้องของสัตว์ นี่คือเสียงแมว นี่คือเสียงนก และถ้ารู้ว่าเป็นนก ก็ต้องรู้ด้วยว่าเป็นนกพันธุ์อะไร

ดังที่ motto ใหญ่ของบริษัทบอกไว้ว่า “Creating ears for artificial intelligence”

การพัฒนารูปแบบนี้จะนำไปซึ่งความเข้าใจที่มากขึ้น เป็นไปได้ว่าต่อไปเพียงแค่คุณเดินกลับเข้ามาในบ้าน ระบบก็สามารถเปิดแอร์ให้คุณได้เลยโดยไม่ต้องสั่ง หรือถ้าได้ยินเสียงจากหน้าบ้าน เราอาจจะถามระบบได้ว่าเสียงใครมาที่หน้าประตูบ้านเช่นนี้เป็นต้น

แต่การพัฒนาาแบบนี้ยังต้องใช้ระยะเวลาอีกซักพักเลยทีเดียว

ซึ่ง Startup จากญี่ปุ่นรายนี้ ได้ทำการทดลองที่ซับซ้อนขึ้น เช่น ..

ถ้าเรานำเสียงบีบแตรของรถยนต์มา ระบบจะสามารถรู้ได้ว่าเป็นเสียงแตรรถ .. อันนี้ไม่ยาก

แต่ถ้าเรานำเสียงบีบแตรรถ มาบีบให้เป็นจังหวะเสียงดนตรี ถามว่า ระบบจะเข้าใจว่านี่คือเสียงแตรรถหรือเสียงดนตรีกันแน่?

คำตอบคือ มันมองว่านี่คือเสียงดนตรี

ซึ่งก็ถือว่าฉลาดไม่เบาเลยทีเดียว

แต่ตัวอย่างที่ยกมานั้นเป็นเพียงแค่หนึ่งในความซับซ้อน ที่เชื่อว่าบนโลกมนุษย์ที่มีเสียงต่าง ๆ มากมายนั้น ยังคงมีความท้าทายอีกมากให้ค้นหา

พอได้เห็นแบบนี้แล้วก็กลับมานึกถึงหูของมนุษย์เรา ที่สามารถแยกแยะทุกอย่างที่ซับซ้อนได้อย่างสุดยอดเลยจริง ๆ

Related Articles

6 แอปฯ สำหรับมนุษย์ออฟฟิศ อยู่ที่ไหนก็ทำงานได้

เพราะการทำงานสมัยนี้ ไม่ได้จำกัดว่าต้องนั่งทำงานอยู่แค่ออฟฟิศ อาจจะต้องออกไปทำงานนอกสถานที่บ้าง หรือเจอสถานการณ์รถติดบ้าง แถมในบางครั้งก็ไม่สะดวกที่จะพก Notebook ติดตัวตลอดเวลาได้ ฉะนั้นแอปพลิเคชันในมือถือ ก็เป็นอีกหนทางหนึ่งที่ตอบโจทย์มากที่สุด วันนี้เราก็ได้คัด…

Article | Technology

3 เหตุผลที่แบรนด์ควรใช้ฟีเจอร์ Story สื่อสารกับคนดูให้มากขึ้น

ไม่กี่วันที่ผ่านมาได้เปิดมือถือ เข้า Facebook เช็กความเคลื่อนไหวบนโลกโซเชียล จู่ ๆ ก็รู้สึกแปลก เหมือนมีอะไรเปลี่ยนไป เลื่อนฟีดไปมา กดเด้งกลับหน้าฟีดบนสุดแล้วถึงบางอ้อ…

Article | Digital marketing
libero. facilisis libero mattis tristique ut justo commodo libero