ผู้ช่วยเสียง Cortana การควบคุมด้วยเสียงของคอมพิวเตอร์บน Windows: เป็นไปได้หรือไม่ วิธีเปิดใช้งานการควบคุมด้วยเสียงของคอมพิวเตอร์ windows 10

สำหรับผู้ทุพพลภาพและสำหรับ sybarites เท่านั้น นักพัฒนา OS ได้สร้าง การควบคุมด้วยเสียงคอมพิวเตอร์. อนุญาตให้ผู้ใช้ป้อนข้อมูลด้วยเสียง หลังจากออกเสียงคำบางคำ อุปกรณ์จะเริ่มการรู้จำเสียง โดยแปลงสัญญาณเสียงเป็นข้อมูลดิจิทัล หลังจากที่รับรู้ข้อมูลที่ป้อนอย่างถูกต้อง - โปรแกรมดำเนินการตามอัลกอริธึมการดำเนินการที่ระบุ - จะทำหน้าที่ที่แนบมากับคำสั่งเฉพาะ

ทุกอย่างค่อนข้างง่าย ระบบจดจำเสียงพูดไม่ถูกต้องเสมอไป ดังนั้นโปรแกรมควบคุมเสียงของคอมพิวเตอร์จึงไม่ได้ใช้อย่างเข้มข้นเพื่อแก้ปัญหาที่ซับซ้อนในการจัดการระบบปฏิบัติการ ใช้เพื่อทำหน้าที่พื้นฐาน: การเปิดและปิดไฟล์ การค้นหาในเครื่องและเครือข่าย ฯลฯ

ประวัติความเป็นมาของการพัฒนาการควบคุมด้วยเสียง

ระบบรู้จำเสียงของ Audrey แรกสร้างขึ้นในปี 1950 เธอถอดรหัสเฉพาะตัวเลขที่พูดเป็นเสียงเดียว
ในปี พ.ศ. 2505 ได้มีการสร้างระบบการรู้จำคำศัพท์ขึ้นเป็นครั้งแรก เธอถอดเสียงภาษาอังกฤษ 15 คำ
ด้วยการพัฒนาคอมพิวเตอร์ในปี 1990 โปรแกรม Dragon Dictate จึงได้รับการพัฒนา เธอจำคำได้ถึง 100 คำต่อนาที แต่มีราคาสูง
ในช่วงต้นปี 2000 แอปการรู้จำเสียง Google Voice Search ปรากฏบน iPhone ในปี 2010 มีการเพิ่มเครื่องมือค้นหาลงใน Android
สิริรวมอยู่ใน ซอฟต์แวร์โทรศัพท์ 4S ในช่วงต้นเดือนตุลาคม 2011;
ในปี 2014 Cortana ผู้ช่วยเสียงสำหรับ Windows ได้รับการแนะนำ

Cortana และความสามารถในการป้อนข้อมูลด้วยเสียงจนถึงปัจจุบัน

Cortana เป็นผู้ช่วยเสมือนในระบบปฏิบัติการ Windows บริการนี้ช่วยให้ผู้ใช้ในการวางแผนสิ่งต่าง ๆ เตือนพวกเขา
เมื่อมีการร้องขอ บริการจะช่วยรวบรวมข้อมูลเฉพาะ สร้างโครงสร้างที่ชัดเจน และนำเสนอต่อผู้ใช้ในรูปแบบที่ประมวลผลได้มากที่สุด
เป็นที่น่าสนใจว่าทันทีที่เปิดใช้งานผู้ช่วยเสมือนจะรวบรวมข้อมูลทั้งหมดเกี่ยวกับคำขอที่ป้อน ข้อมูลส่วนบุคคล พยายามปรับให้เข้ากับผู้ใช้แต่ละคนให้มากที่สุด

การควบคุมด้วยเสียงของคอมพิวเตอร์ Windows 7 ผ่านการใช้ผู้ช่วยเสมือนไม่สามารถทำได้ - มันรวมอยู่ในรุ่นที่สิบเท่านั้น แต่น่าเสียดายที่นักพัฒนาไม่สนใจที่จะปล่อยเวอร์ชันภาษารัสเซีย
การค้นหามีบทบาทหลักซึ่งสามารถเปิดได้ใน 10-ke ผ่าน "เริ่ม" ฟังก์ชันนี้กำหนดคำค้นหาเกือบทั้งหมด หากระบบไม่รู้จักรายการ คุณสามารถป้อนคำสั่งที่เหมาะสมในหน้าต่างป๊อปอัปและโปรแกรมควบคุมเสียงของคอมพิวเตอร์จะอ่านข้อมูลข้อความ

ช่วงเวลาที่ไม่พึงประสงค์คือการรวบรวมข้อมูลทั้งหมดที่ป้อนผ่านแป้นพิมพ์และส่งไปยัง Microsoft

โปรแกรมบุคคลที่สาม

พิมพ์

หลังจากติดตั้งเสร็จแล้ว ให้ไปยังขั้นตอนถัดไป - create บัญชีผู้ใช้. ที่นี่คุณต้องสร้างวลีสำคัญหลังจากนั้นจะมีเสียงแจ้งเตือนการเปิดใช้งาน

ต่อไป คุณจะต้องสร้างคำสั่งเสียงโดยไม่คำนึงถึงจุดประสงค์ คำสั่ง dog สามารถเปิดแอปพลิเคชันหรือทำอย่างอื่นได้ทั้งหมด

คุณเพียงแค่ต้องสร้างคำสั่งเสียงและกำหนดให้กับการกระทำเฉพาะ เหมาะสำหรับการดำเนินการขั้นพื้นฐานเท่านั้น - เปิดไฟล์ โฟลเดอร์ ฯลฯ ฟังก์ชันมีจำกัด

ลำโพง

ฟังก์ชันนี้กว้างกว่าในประเภท

การควบคุมด้วยเสียงของคอมพิวเตอร์ Windows 10 ทำให้ผู้ใช้สามารถเปิดและปิดไฟล์ ถ่ายภาพหน้าจอของหน้าจอ ปิดพีซีได้

การรู้จำเสียงใช้เวลานานกว่า 3-4 วินาที นี่เป็นเพราะความจริงที่ว่าคำพูดถูกแปลงเป็นข้อความก่อนและคอมพิวเตอร์จะรู้จักคำสั่งจากข้อมูลที่เป็นข้อความ

Laitis

มัน โปรแกรมฟรีซึ่งช่วยให้คุณควบคุมพีซีและกำหนดข้อความได้ หลังการติดตั้ง คุณต้องลงทะเบียนและใช้งานเพื่อความพึงพอใจของคุณ

ฟังก์ชันแก้ไขอัตโนมัติที่น่าสนใจเมื่อพิมพ์ คุณสามารถพูดว่า "เครื่องหมายคำพูด" และอักขระที่เกี่ยวข้องจะปรากฏในข้อความ

ความเป็นไปได้ของการควบคุมเสียงผ่าน Yandex.string

เมื่อใช้แอปพลิเคชันนี้ คุณสามารถค้นหาข้อมูลและไฟล์ในพื้นที่หรือเครือข่าย รีสตาร์ทหรือปิดเครื่องคอมพิวเตอร์ของคุณ มีฟังก์ชั่นเปิดโปรแกรมและไซต์ต่างๆ
ในการใช้โปรแกรม คุณต้องดาวน์โหลดและติดตั้งก่อน

แต่ในระหว่างการติดตั้ง คุณควรยกเลิกการเลือกรายการที่ผู้ผลิตซอฟต์แวร์เสนอให้ติดตั้งเบราว์เซอร์ เปลี่ยนการตั้งค่า มิฉะนั้น การติดตั้งจะใช้เวลานานขึ้นและการกำหนดค่าจะเปลี่ยนแปลงในเบราว์เซอร์
ในที่สุดบรรทัดจะถูกวางไว้ใกล้กับปุ่ม "เริ่ม" พูดว่า "ฟัง Yandex" แล้วหน้าต่างจะเปิดขึ้น

พูดคำร้อง.

หลังจากหยุดชั่วคราว แถบค้นหาจะเปิดขึ้นในเบราว์เซอร์ การจัดการการค้นหาด้วยวิธีนี้เป็นความคิดที่ดี
โดยทั่วไปแล้ว การควบคุมด้วยเสียงของคอมพิวเตอร์ยังไม่ได้รับการพัฒนา เนื่องจากมันถูกวาดขึ้นในจินตนาการ แต่ถึงแม้คุณสมบัติเหล่านั้นที่มีอยู่ในปัจจุบันก็น่าประทับใจอยู่แล้วและช่วยยกระดับการใช้พีซีในระดับใหม่ได้อย่างมาก

มีวันที่ดี!

คุณสามารถโต้ตอบกับคอมพิวเตอร์ได้ไม่เพียงแค่ใช้แป้นพิมพ์และเมาส์เท่านั้น นอกจากนี้ยังมีการควบคุมคำสั่งเสียง มียูทิลิตี้พิเศษที่ให้คุณทำสิ่งนี้ได้ ฟังก์ชันเหล่านี้ไม่เพียงแต่บันทึกข้อความจากการป้อนตามคำบอกหรือการถอดเสียงการบันทึกเสียงเท่านั้น คุณสามารถเรียกใช้แอปพลิเคชัน ใช้งานได้ และโดยทั่วไปแล้ว - ทำทุกอย่าง การควบคุมคอมพิวเตอร์ด้วยเสียงทำให้การทำงานกับพีซีทำได้ง่ายขึ้น คำสั่งจะถูกส่งไปอย่างรวดเร็วและง่ายดาย แน่นอนว่าถ้าคุณมีไมโครโฟน

เราจะแนะนำให้คุณรู้จักกับแอปพลิเคชันที่มีฟังก์ชันการทำงานที่คล้ายคลึงกัน

คุณลักษณะนี้สร้างขึ้นในภาษาอังกฤษ เวอร์ชั่น Windows. คุณต้องมีใบอนุญาต Enterprise หรือ Ultimate เพื่อใช้งาน แต่ยังอยู่ใน Russified ระบบปฏิบัติการคุณสามารถตั้งค่าการควบคุมด้วยเสียงและการป้อนตามคำบอกข้อความ ใช้หนึ่งในแอปพลิเคชันต่อไปนี้

แอพนี้เข้าใจง่าย

โปรแกรมยอดนิยม แม้ว่าจะมีข้อเสียอยู่บ้าง สาระสำคัญของงานนั้นเรียบง่าย: คุณตั้งค่าคำสั่งและเลือกสิ่งที่ควรทำ พิจารณาตั้งค่าแอปพลิเคชันนี้โดยใช้ตัวอย่างเฉพาะ

ดาวน์โหลดและติดตั้ง มีเวอร์ชันฟรีและพรีเมียม ต้องซื้ออันที่สองเพื่อลองใช้บนคอมพิวเตอร์
เรียกใช้ยูทิลิตี้ หน้าต่างข้อมูลพร้อมคำแนะนำจะปรากฏขึ้น
แผงควบคุมมีฟังก์ชันต่างๆ มากมาย บางคนมีชื่อเดียวกัน จำเป็นต้องนำทางด้วยรูปภาพไม่ใช่ตามคำจารึก กดปุ่ม "เพิ่ม" - จะแสดงใบหน้า
ระบุชื่อโปรไฟล์และคีย์เวิร์ดเพื่อระบุคำสั่ง ตัวอย่างเช่น เขียนว่า "เปิด" หากคุณกำลังจะตั้งค่าการเปิดแอปพลิเคชันบางตัวด้วยเสียง หรือ "ไปที่" เพื่อไปที่ไซต์ทันทีโดยไม่ต้องป้อนที่อยู่
ตอนนี้เราต้องบันทึกคำสั่งนี้ในรูปแบบของภาพเสียง คลิกที่ปุ่มที่มีวงกลมสีแดง และออกเสียงวลีที่ต้องการลงในไมโครโฟนอย่างชัดเจน
ยืนยันการเปลี่ยนแปลง ตัวเลือกที่ระบุจะปรากฏในรายการในหน้าต่างประเภท โปรแกรมจะจดจำสิ่งที่คุณบันทึกไว้ใน "เครื่องบันทึกเสียง"
หลังจากนั้นให้ระบุสิ่งที่จะเรียกใช้เพื่อรันคำสั่ง คลิกปุ่ม "เพิ่ม" ซึ่งดูเหมือนมือที่มีสัญลักษณ์ "+" (บวก)
เลือกรูปแบบข้อมูล: ไฟล์/ยูทิลิตี้, หน้าเว็บ, บริการ OS ภายในบางอย่าง ใส่ช่องทำเครื่องหมายที่คุณต้องการ
ค้นหาแอปพลิเคชันที่คุณต้องการเปิดใช้ด้วยเสียงของคุณ ปล่อยให้มันเป็นเช่น Microsoft Word คุณจึงสามารถเริ่มแก้ไขข้อความหรือเขียนบทความได้อย่างรวดเร็ว
ในหน้าต่างเดียวกัน ให้จดส่วนที่สองของคำสั่ง สรุปได้ว่า "เปิดพระคำ" คำแรกจะเปิดใช้งาน Type คำที่สองจะเปิดใช้งานยูทิลิตี้ที่เกี่ยวข้อง
คลิกเพิ่ม
คุณสามารถแนบหลายแอปพลิเคชันเข้ากับฟังก์ชัน "เปิด" ฟังก์ชันเดียวได้ ด้วยวิธีนี้ คุณจะควบคุมการเปิดตัวโดยไม่ต้องแตะเมาส์และอุปกรณ์ต่อพ่วงอื่นๆ ที่ติดตั้งบนคอมพิวเตอร์
หากจำเป็น ให้แก้ไขพารามิเตอร์เพิ่มเติม
หากต้องการตรวจสอบว่าใช้งานได้หรือไม่ ให้คลิกที่ "เริ่มพูด" แล้วพูดคำสั่ง

โปรแกรมนี้ทำงานร่วมกับภาษารัสเซีย แต่ก็ไม่ได้รับรู้อย่างถูกต้องเสมอไป จำเป็นต้องพูดเสียงดังชัดเจนด้วยเสียงกลไก

ไม่จำเป็นต้องมีความรู้ภาษาอังกฤษ
การสร้างคำสั่งด่วน

ไม่มีการจดจำข้อความ
ฟังก์ชันที่จำกัด คุณสามารถเปิดยูทิลิตี้และเพจบนอินเทอร์เน็ตเท่านั้น
บางครั้งโปรแกรมจะรับรู้เสียงรบกวนจากภายนอกเป็นคำสั่ง ด้วยเหตุนี้ สิ่งแปลกประหลาดจึงเกิดขึ้นบนพีซี
คุณไม่สามารถทำงานกับผู้เล่นได้

สุนทรพจน์

แอปพลิเคชั่นอื่นสำหรับการจัดการคอมพิวเตอร์

ในการเริ่มต้นครั้งแรก หน้าต่างจะเปิดขึ้นพร้อมตัวเลือกหมวดหมู่: พีซีหรืออินเทอร์เน็ต
นอกจากนี้ยังมีคำอธิบายว่าคีย์ผสมใดเพื่อเปิดใช้งานยูทิลิตี้ ซึ่งสามารถเปลี่ยนแปลงได้ในการตั้งค่า
คลิกที่ "อินเทอร์เน็ต" ตัวอย่างเช่น หน้าต่างจะเปิดขึ้นพร้อมช่องป้อนข้อมูลหลายช่อง: สำหรับข้อความคำสั่งและสำหรับ URL ของเว็บไซต์ คุณสามารถเขียนคำว่า "Yandex" และที่อยู่ของหน้านี้
คลิกเพิ่ม
กดปุ่มที่ระบุบนหน้าต่างหลักค้างไว้
พูดคำสั่งเพื่อให้ยูทิลิตี "จดจำ" ได้

เปิดใช้งานทั้งปุ่มและระดับเสียง
เมื่อเริ่มต้น คุณสามารถปรับเทียบไมโครโฟนได้

ฟังก์ชันที่จำกัด

ลำโพง

อินเทอร์เฟซได้รับการออกแบบในแบบมินิมอล

คำสั่งในแอปพลิเคชันกำหนดค่าโดยใช้คำที่พิมพ์ ไม่ใช่การป้อนตามคำบอก มีกลไกการจดจำข้อความภายใน หน้าที่หลัก:

สร้างภาพหน้าจอตามคำสั่ง
เปลี่ยนรูปแบบแป้นพิมพ์บนคอมพิวเตอร์ของคุณ
การเปิดโปรแกรมและไฟล์
เสร็จสิ้นการทำงาน

คุณไม่สามารถทำการบันทึกเสียงกับทีมงานได้ ยูทิลิตีรู้จักฉลาก

คุณต้องใช้แป้นพิมพ์เพื่อควบคุม หากใช้ปุ่มที่ระบุเพื่อวัตถุประสงค์อื่นจะไม่สะดวก
คุณต้องมีการเชื่อมต่ออินเทอร์เน็ตที่เสถียร

Gorynych

ฮีโร่ของนิทานพื้นบ้านรัสเซียจะช่วยคุณ

โปรแกรมควบคุมคอมพิวเตอร์ด้วยเสียง "Gorynych" เป็นผลิตภัณฑ์ในประเทศ ดังนั้นจึงมีโมดูลการรู้จำเสียงพูด "ดั้งเดิม" มัน "ปรับ" ให้เข้ากับเสียงต่ำและเสียงสูงของผู้ใช้ ด้วยยูทิลิตี้นี้ คุณสามารถทำงานในระบบได้อย่างเต็มที่ ไม่ใช่แค่เปิดไฟล์และหน้าเว็บ

มีการรองรับภาษารัสเซียและภาษาอังกฤษ
การรับรู้ข้อความ ใส่เสียงถึงบรรณาธิการใด ๆ
ฟังก์ชั่นเสริม

จำเป็นต้องสร้างคำสั่งสำหรับแต่ละกระบวนการอย่างอิสระ แท้จริงแล้วคุณต้องจดพจนานุกรม

การรู้จำเสียงของ Windows

โปรแกรมที่สร้างขึ้นในระบบปฏิบัติการภาษาอังกฤษ เมื่อต้องการใช้งาน คุณต้องติดตั้งชุดภาษาที่เหมาะสม ทีมรัสเซียจะไม่ทำงานกับเธอ ในการควบคุมพีซีด้วย คุณจะต้องพูดภาษาของมัน ในการเข้าถึงในแผงควบคุม การตั้งค่า Windowsเปิดเมนู " มาตรฐานภูมิภาคและภาษา" (อยู่ในหมวด "ชั่วโมง ภาษา ภูมิภาค") และตั้งค่า "ภาษาอังกฤษ" ในทุกแท็บ หากทุกอย่างถูกต้อง และคุณได้ติดตั้งชุดภาษาที่จำเป็นแล้ว Windows จะ "เปลี่ยน" เป็นภาษาอังกฤษ และยูทิลิตี้นี้จะพร้อมใช้งาน จะดีกว่าที่จะไม่ลองใช้วิธีนี้หากคุณไม่รู้ภาษาต่างประเทศดีพอ

วิธีนี้เหมาะถ้าคุณพูดภาษาอังกฤษ

สาธารณูปโภคอื่นๆ

มีแอพพลิเคชั่นมากมายสำหรับจัดการคำสั่งดังกล่าว:

ส่วนขยายเบราว์เซอร์ อำนวยความสะดวกในการท่องเว็บ ที่ Google Chromeมีฟังก์ชั่นที่คล้ายกันอยู่แล้ว - การป้อนข้อมูลด้วยเสียงในรูปแบบการค้นหา ตัวเลือกนี้มีอยู่ในแผนที่ออนไลน์บางแผนที่ ช่วยให้คุณค้นหาที่อยู่ได้อย่างรวดเร็ว
ประเภทเสียง
เรียลสปีกเกอร์
คำพูดของเว็บ

รายการซอฟต์แวร์จดจำข้อความและเขียนตามคำบอก

แน่นอนว่าการควบคุมด้วยเสียงนั้นดี แต่ยูทิลิตี้สำหรับ OCR และการพิมพ์จากการเขียนตามคำบอกนั้นมีประโยชน์ เมื่อรวบรวมรายงานจำนวนมาก ประกาศนียบัตร การเขียนความคิดของคุณง่ายขึ้นโดยการเปล่งเสียงลงในไมโครโฟนบนคอมพิวเตอร์ นี่คือบางส่วนของยูทิลิตี้เหล่านี้:

การเขียนตามคำบอก
มังกรพูดอย่างเป็นธรรมชาติ
ถาวรมือถือ

ผลิตภัณฑ์ที่ให้คุณกำหนดข้อความไปยังคอมพิวเตอร์

คุณสามารถตั้งค่าคำสั่งเสียงในระบบปฏิบัติการ ในการดำเนินการนี้ ต้องติดตั้งโปรแกรมที่เหมาะสมบนคอมพิวเตอร์ ด้วยวิธีนี้ คุณสามารถทำงานบนพีซี นอนบนโซฟา หรือนั่งพักผ่อนบนเก้าอี้นวม คุณจะมีมือว่าง หากไมโครโฟนดีและเก็บเสียงได้แม้ห่างไกลหรือเงียบ คุณก็ไม่จำเป็นต้องนั่งข้างๆ คุณสามารถ "พูดคุย" กับคอมพิวเตอร์พร้อมกันและเขียนโน้ตลงในสมุดบันทึก วาด ถืออะไรบางอย่างได้ ใช่แม้กระทั่งเย็บและถัก ด้วยคำสั่ง การโต้ตอบกับพีซีจะง่ายขึ้นมาก ในการเปิดใช้งานยูทิลิตี้เหล่านี้บางอย่าง คุณต้องกดปุ่มบนแป้นพิมพ์ซึ่งไม่สะดวกนัก

แต่ก็มีแง่ลบเช่นกัน หากคุณเผลอพูดคำคำสั่ง แอปพลิเคชันที่ไม่จำเป็นโดยสมบูรณ์ในตอนนี้จะเปิดขึ้นหรือเบราว์เซอร์จะไปที่ไซต์ที่ไม่ถูกต้อง จะใช้อะไรและใช้หรือไม่ - ขึ้นอยู่กับคุณ

วันนี้เราจะพูดถึงคำพูดของเรา คุณชอบ ควบคุมคอมพิวเตอร์ด้วยเสียงโดยไม่ต้องใช้นิ้วช่วย? และอย่างที่พวกเขาพูดด้วยพลังแห่งความคิด! จริงอยู่ เราจะไม่ควบคุมคอมพิวเตอร์ด้วยพลังแห่งความคิด แต่ด้วยพลังเสียง มันค่อนข้างจริง

พิมพ์โปรแกรม- นี่เป็นหนึ่งในซอฟต์แวร์ที่ดีที่สุดสำหรับการควบคุมคอมพิวเตอร์ผ่านเสียง บนเว็บไซต์ในความคิดเห็นของโปรแกรมนี้ ความคิดเห็นมาบรรจบกัน

จริงอยู่ มันมีข้อบกพร่อง แต่เพิ่มเติมในภายหลัง อย่างไรก็ตาม หากคุณสนใจ อ่านบทวิจารณ์ของฉัน

คุณสามารถดาวน์โหลดโปรแกรมได้ที่นี่: http://freesoft.ru/type

วิธีการใช้งาน? ขั้นแรก ให้เรียกใช้และดูปุ่มควบคุมหลัก:

โปรแกรมยินดีต้อนรับเราและให้คำแนะนำเกี่ยวกับวิธีใช้ Type ทันที ในตอนเริ่มต้น เราจะกดปุ่ม "เพิ่ม" และเขียนคำนั้นลงไป เช่น "เปิด" เมื่อต้องการทำสิ่งนี้ ให้พูดคำนี้ลงในไมโครโฟน:

จากนั้นคลิกเพิ่ม ดังนั้นเราจึงบันทึกคำว่า "เปิด" ในโปรแกรมด้วยเสียงของเรา คุณสามารถพูดคำอื่นๆ ลงในไมโครโฟนได้ สิ่งสำคัญคืออย่าสับสน

ขั้นตอนต่อไปคือการเพิ่มคำสั่ง ไปที่จุดนี้:

จากนั้นเราทำเครื่องหมายที่ช่องถัดจากรายการที่เราต้องการ:

เลือกโปรแกรม แอปพลิเคชัน หรือการดำเนินการ แล้วคลิกปุ่มบันทึกสีแดง หากคอมพิวเตอร์ยอมรับเสียงของเรา ให้คลิก "เพิ่ม":

และตอนนี้คำสั่งเสียงหนึ่งคำสั่งจะปรากฏในโปรไฟล์ของเรา ในกรณีนี้อันที่เปิด 7-Zip:

และตอนนี้โดยการกดปุ่มสุดท้าย "เริ่มพูด"

เราพูดวลี "open Seven Zip" ในกรณีของฉัน ทุกอย่างจะได้ผล และโปรแกรม 7-zip จะเปิดขึ้น จำวลีนี้: ซิมเปิด? นี่คือสิ่งที่เหมือนกัน

โปรแกรมทำงานไม่ถูกต้องเสมอไป ตอนนี้ภาษารัสเซียอันยิ่งใหญ่ยังไม่ได้รับการศึกษาอย่างเต็มที่จากโปรแกรมเมอร์นักภาษาศาสตร์ ... แต่ก็ยังดีที่คอมพิวเตอร์จะเชื่อฟังคุณ

ดังนั้นสำหรับการทดสอบและความอยากรู้ซ้ำซาก โปรแกรม Typle จึงเหมาะสม 100%

ในวิดีโอนี้ คุณสามารถดูประวัติของการสร้างเครื่องมือเสียงแรกและสิ่งอื่นที่เราต้องดำเนินการ:

มีชื่อที่คล้ายคลึงกันอื่น ๆ ของโปรแกรมเช่น Gorynych, Perpetuum, Dictograph, Voice Commander แต่ทั้งหมดนั้นไม่ใช่ "อันนั้น" อย่าผ่านการวิพากษ์วิจารณ์โปรแกรมที่คู่ควร

ฉันใช้เวลา 5 นาทีในการเรียนรู้โปรแกรมนี้ ค่อนข้างนาน (ส่วนใหญ่ฉันเข้าใจโปรแกรมดังกล่าวใน 1-2 นาที) หากคุณมีคำถามใด ๆ - เขียน แล้วเจอกันนะเพื่อนๆ :)!

ในอีกความพยายามที่จะนำแนวคิดจากภาพยนตร์นิยายวิทยาศาสตร์มาใช้ ยักษ์ใหญ่ด้านเทคโนโลยีเริ่มทำงานกับผู้ช่วยเสมือนทีละคน ในการประชุม Google I/O 2016 บริษัท แนะนำ Google Assistant เช่นเดียวกับแอนะล็อกของ Amazon Echo - home ผู้ช่วยเสียงหน้าแรกของ Google

บริษัทใหญ่รายสุดท้ายที่เข้าร่วมการแข่งขันผู้ช่วยเสมือน มาดูกันว่ามีคู่แข่งอะไรบ้าง (รวมถึงสตาร์ทอัพด้วย)

10 ผู้ช่วยเสมือน: ภาพรวม

Alexey Zenkov

อันดับแรก ให้จำไว้ว่า Google Now คืออะไร

Google/Google Now ค้นหาด้วยเสียง

ลักษณะเฉพาะ:เร็ว. แม่นยำอย่างยิ่งเมื่อสร้างเส้นทาง มันสร้างความตื่นตระหนกให้กับเที่ยวบิน การจอง และรายละเอียดอื่นๆ ของคุณ กับบางอย่าง แอปพลิเคชันบุคคลที่สาม: จัดการโน้ต ข้อความ และการเล่นเพลง

ข้อบกพร่อง:บางครั้งมันก็รบกวนคุณด้วยความคิดริเริ่มที่มากเกินไป (เช่น แสดงผลการแข่งขันของทีมที่คุณไม่สนใจ หรือเส้นทางกลับบ้านจากสถานที่ที่มีชื่อเสียง) ไร้ประโยชน์เมื่อจัดการ "บ้านอัจฉริยะ" การทำงานเกี่ยวกับการผสานรวมกับแอปพลิเคชันของบุคคลที่สามดูเหมือนจะหยุดชะงัก

ระดับมนุษยชาติ:โมฆะ. ไม่เอื้อต่อการสื่อสาร ไม่มีแม้แต่ชื่ออื่นนอกจาก Google

สรุป:ในทางทฤษฎีแล้ว การครอบครองข้อมูลส่วนบุคคลจำนวนมากและการเข้าถึงเสิร์ชเอ็นจิ้นควรทำให้ Google เป็นผู้นำในอุตสาหกรรม แต่บริษัทยังไม่ได้คิดหาวิธีใช้ประโยชน์จากข้อดีของตนเพื่อสร้างผู้ช่วยที่สามารถเข้าใจผู้ใช้ได้ วันนี้ Google Now และ ค้นหาด้วยเสียงพวกเขาแข่งขันกันอย่างเท่าเทียมกันกับ Siri แต่ยังไม่ถึงระดับใหม่ของการพัฒนา

และตอนนี้ - เกี่ยวกับคู่แข่ง

แอปเปิ้ล สิริ

อะไร:ผู้ช่วยเสียงที่สามารถพูดคุยกับผู้ใช้และให้คำแนะนำเชิงรุก เปิดใช้งานโดยกดปุ่มโฮมบนและ iPad ค้างไว้ การสนับสนุนผู้ช่วยเพิ่งปรากฏบน Apple TV และ Apple Watch

ลักษณะเฉพาะ:ใช้งานง่ายบนอุปกรณ์ iOS เข้าใจคำพูดที่เป็นธรรมชาติ ข้อมูลข่าวสาร พยากรณ์อากาศ กีฬา ภาพยนตร์ เส้นทาง และธุรกิจในท้องถิ่นเป็นอย่างดี สามารถบอกคุณได้ว่าจะดูอะไรในทีวี สามารถโต้ตอบกับองค์ประกอบบางอย่างของ "บ้านอัจฉริยะ"

ข้อบกพร่อง:ไม่สามารถโต้ตอบกับแอปพลิเคชันและบริการอื่นๆ ส่วนใหญ่ได้ ทำงานช้ากว่าคู่แข่งบางราย

ระดับมนุษยชาติ:ไม่สามารถรักษาการสนทนาได้เต็มที่ แต่ในบางจุดก็แสดงให้เห็นถึงภูมิปัญญาของเขาเอง เสียงผู้หญิงฟังดูค่อนข้างเป็นมนุษย์

ข้อบกพร่อง:ใช้งานได้ดีบน Windows - แพลตฟอร์มที่นักพัฒนาและบางทีผู้ใช้อาจสนใจน้อยที่สุด การใช้ตัวช่วยบน Android และ iOS นั้นยากกว่าและมีฟังก์ชันน้อยกว่า

ระดับมนุษยชาติ:เขาชอบเรื่องตลกโดยเฉพาะเรื่องซ้ำซากจำเจ มีรายการคำตอบที่มีไหวพริบมากมายสำหรับคำถามทั่วไปพร้อม สามารถอ่านข้อความที่ตัดตอนมาจากเช็คสเปียร์

สรุป:หลังจากหลายปีที่อยู่ภายใต้เงาของ Siri และ Google Cortana ก็กลายเป็นแชทบ็อตที่น่าสนใจยิ่งขึ้น Microsoft ต้องการสร้างของตัวเอง ผู้ช่วยเสียงข่าวกรองพื้นฐานสำหรับบ็อตอื่นๆ ทั้งหมดที่สามารถจัดการการเดินทาง การนัดหมาย รายการสิ่งที่ต้องทำ และสิ่งอื่น ๆ ของคุณ รวมทั้งเพิ่มระดับการผสานรวมกับผลิตภัณฑ์อื่นๆ ของ Microsoft เช่น Office บริษัทมีเป้าหมายที่จะสร้างเปลือกใหม่สำหรับการประมวลผลหลังพีซี แต่ยังเร็วเกินไปที่จะบอกว่ามันจะสำเร็จหรือไม่

Facebook M

อะไร:ขับเคลื่อนบางส่วน ส่วนหนึ่งเป็นมนุษย์ และยังอยู่ระหว่างการพัฒนา M จะเป็นผู้ช่วยแบบข้อความในสภาพแวดล้อม Facebook Messenger

ลักษณะเฉพาะ:จะพยายามทำทุกอย่างที่ขอ

ข้อบกพร่อง:มันยังไม่ใช่ผลิตภัณฑ์สำเร็จรูปและจะไม่นาน ใช้ได้เฉพาะกับผู้ใช้จำนวนน้อยในซานฟรานซิสโก

ระดับมนุษยชาติ:สูงมากเนื่องจากผู้คนจะมีส่วนร่วมในการตอบคำถาม จากข้อมูลของ Wired บริษัทหวังว่าเมื่อเวลาผ่านไป M จะได้เรียนรู้จากโอเปอเรเตอร์เหล่านี้และสามารถทำงานได้อย่างอิสระมากขึ้น

สรุป:ในขณะนี้ M เป็นมากกว่าแค่ความคิดเพียงเล็กน้อย แต่เมื่อพิจารณาจากความสนใจของ Facebook ในแชทบ็อตโดยทั่วไป จึงไม่น่าแปลกใจเลยที่ M จะกลายเป็นอัจฉริยะ

X.ai

อะไร:หนึ่งในผู้ช่วยเสมือนไม่กี่คนที่มีฟังก์ชันเดียว ทำงานผ่านอีเมลเท่านั้น ซึ่งเขาสามารถนัดหมายตามคำขอของคุณได้

ลักษณะเฉพาะ:รู้กำหนดการและความชอบของคุณ เจรจากับผู้เข้าร่วมคนอื่นๆ ให้กับคุณ

ลักษณะเฉพาะ: Viv สัญญาว่าผลิตภัณฑ์ของพวกเขาจะสามารถเข้าใจคำถามที่ซับซ้อนได้ เช่น: “อุณหภูมิใกล้สะพาน Golden Gate จะเกิน 20 องศาในวันมะรืนหลัง 17.00 น. หรือไม่” กำลังดำเนินการเพื่อให้มั่นใจว่าสามารถใช้งานร่วมกับแอปพลิเคชันของบุคคลที่สามได้

ข้อบกพร่อง:จนถึงตอนนี้ นอกเหนือจากการนำเสนอที่เตรียมไว้แล้ว ยังไม่มีหลักฐานว่าทุกอย่างทำงานตรงตามที่ระบุไว้

ระดับมนุษยชาติ:ค่าโสตทัศนูปกรณ์และคำตอบที่เป็นรูปธรรมมากกว่า คำอธิบายโดยละเอียด. ปัญญาเป็นที่น่าสงสัย

ข้อบกพร่อง:ความเป็นไปได้ในการรวมเข้ากับแอปพลิเคชันของบุคคลที่สามนั้นมีจำกัด และไม่สามารถเปิดบริการได้โดยตรงบน iOS หรือ Android คำขอที่ผู้ช่วยไม่รู้จักจะถูกเปลี่ยนเส้นทางไปที่ Ask.com

ระดับมนุษยชาติ:ไม่เอื้อต่อการสนทนาที่ยาวนาน แต่รู้วิธีตอบคำถามเพิ่มเติม

สรุป:ดูเหมือนว่า แอปพลิเคชั่นมือถือ Hound มีอยู่จริงเพียงเพื่อแสดงความสามารถของบริการ Houndify ซึ่ง SoundHound วางแผนที่จะขายให้กับบริษัทอื่น หากทุกอย่างเป็นไปด้วยดี เราจะไม่รู้ด้วยซ้ำว่าเรากำลังใช้มันอยู่

ออซโล

อะไร: AI หน้าที่หลักในขณะนี้คือการค้นหาร้านกาแฟ บาร์ และร้านอาหาร มีให้สำหรับผู้ใช้จำนวนจำกัด

ลักษณะเฉพาะ:ค้นหาและรวมข้อมูลจากหลายแหล่ง รวมทั้ง Yelp และ Foursquare จากนั้นนำเสนอทุกอย่างในรูปแบบการ์ดที่สะดวก พยายามสื่อสารด้วยการถามและตอบคำถามติดตามผล เช่น "ขณะนี้เปิดสถานที่ใดบ้าง" หรือ “มีเมนูอะไรบ้าง”

ข้อบกพร่อง:ฟีเจอร์ที่จำกัด เว้นแต่ผู้สร้าง Ozlo จะเพิ่มคุณสมบัติใหม่ เมื่อเรียนรู้ AI จะขึ้นอยู่กับผู้ใช้เป็นอย่างมาก

ระดับมนุษยชาติ:หลีกเลี่ยงมารยาทที่ไม่จำเป็น เพียงทักทายสั้นๆ ตามชื่อเท่านั้น

สรุป: Ozlo ก็ไม่ต่างจากแชทบ็อตอื่นๆ มากมาย หากไม่มีโอกาสในการสร้างสิ่งที่ใหญ่กว่านี้ ความสามารถในการรวมข้อมูลจากหลายแหล่งในเอาต์พุตเดียวนั้นไม่เหมือนใคร แต่ยังไม่ชัดเจนว่านักพัฒนาจะสามารถตระหนักถึงศักยภาพสูงสุดที่พวกเขาอ้างสิทธิ์ได้หรือไม่ ตราบใดที่แผนธุรกิจของ Ozlo จำกัดอยู่แค่แอป การรวบรวมข้อมูลที่จำเป็นสำหรับการฝึกอบรมอาจเป็นเรื่องยาก

SpeakToIt Assistant.ai

อะไร:หนึ่งในหลาย ๆ สำเนาของ Siri ใน App Store การค้นหา Siri จะแสดงโปรแกรมที่คล้ายกันมากมาย เช่น คำสั่งเสียง เลขานุการเสียง และผู้ช่วย

ลักษณะเฉพาะ:ไม่ต่างจาก Siri แต่สามารถเรียนรู้คำสั่งของผู้ใช้เพื่อเปิดใช้งานรายการคุณสมบัติต่างๆ

ข้อบกพร่อง:ไม่มีประโยชน์เท่ากับผู้ช่วยในตัวในสมาร์ทโฟนของคุณ และไม่สะดวกเท่า

ระดับมนุษยชาติ:ฟังดูค่อนข้างไม่เป็นธรรมชาติ แต่แสดงภาพตัวเองเป็นผู้ช่วยมนุษย์ที่มีเพศและ รูปร่างสามารถเปลี่ยนแปลงได้

สรุป:สำเนาของ Siri เหล่านี้บางส่วนดูเหมือนของที่ระลึกในอดีตเมื่อไม่ได้ทั้งหมด รุ่นไอโฟนสามารถทำงานร่วมกับผู้ช่วยที่เป็นกรรมสิทธิ์ของ Apple และจำเป็นต้องเปลี่ยน ไม่ว่าในกรณีใด ดูเหมือนว่าผู้สร้างของพวกเขาจะทราบดีว่าวิธีการดังกล่าวจะไม่อนุญาตให้พวกเขาประสบความสำเร็จ ตัวอย่างเช่น SpeakToIt ย้ายไปสร้างชุดเครื่องมือที่นักพัฒนารายอื่นสามารถใช้เพื่อสร้างแชทบ็อตของตนเองได้