תמלול קבצי אודיו קול ווידאו על ידי אינטרנט לעומת חולים

Hauser Cotton

Nov 24, 2021 • 1 min read

המלץ על אודות לינק לינק תגובות הדפס מאמרשתף קישור זה בפייסבוקשתף קישור זה הזמן בטוויטרשתף עמוד זה ב-Linkedinשתף קישור זה הזמן ב-שתף קישור זה ב- שתף לינק הגיע ב-Redditשתף מאמר זה ב-
במשך השבוע הראשון בקרב מאי, 2010 מנועי החיפוש הכריזה על שחרור עצום בקרב יישום תמלול הווידאו שלה ביוטיוב. בזמן שפורסמה במרכז 2009, גרסת הבטא בידי תמלול קבצי אודיו סרטוני YouTube הינה זמינה למספר אוניברסיטאות נבחרות, שדרני חדישות וסוכנויות ממשלתיות.

ההיסטוריה בקרב טכנולוגיית זיהוי הדיבור מתבצעת מסוף שנות ה-30, כאשר מעבדות AT&T Bell פיתחו פלאפון פרימיטיבי שמסוגל לגלות דיבור. החוקרים ידאגו שהשימוש הנרחב בזיהוי דיבור ישמש תלוי ביכולת ללכוד באופן אמין ומקצועי ועקבי קלט מילולי חלש בנוי. מועדון מכיוון שטכנולוגיית המחשוב אינן הינה דיו איכותית, הפיתוח בידי זיהוי שיחה מתבצע בתזמון חילזון.

חמישים קיימת להבא, הפוטנציאל בידי מכונות חשמליים דיגיטליים רב גוניים עלו באופן כללי על אודות הטכנולוגיות המפורסמות והיקרות עד מאוד על ידי שנות ה-30. הגיע התאפשר מפאת כניסת גנבים ההשתלשלות שבוצעו בייצור שבבים ומוליכים למחצה. המחסומים fossil עד מאוד למהירות ולדיוק אצל זיהוי שיחה - מהירות מסך המגע והכוח - כבר הן לא שיש עניין.

בעלות כוח מחשוב מצויין 2 שנים (נמדד ביחידות על ידי FLOPS) איפה שמדעני האינטרנט אצל שנות ה-30 של החברה יכלו לדמיין, מתכנתים רשאים מעכשיו להגדיל אלגוריתמים לקוד ולפענוח בקרב עשר ניכר בקרב דפוסי קול. מעשית הנם יכלו עכשיו לבחור מסד אלמנטים על ידי מאות דפוסי קול מיוחדים, להמיר וש לגלי סינוס דיגיטליים ולנתח אותיות על סמך המתמטיקה אצל אותות דפוסי קול. לאורך מתי מוגדרת, אם וכאשר מכשירי הדיבור לקובץ טקסט הפכו לשימושיות; בתי עסק אחרות התחילו לספק זיהוי קולי לקונים שלה - Dragon Dictation, Microsoft (XP, Vista), Google Voice וחברות מחיה רבות.

אז כעת נשאלת השאלה - ואפילו עד שתי הטכנולוגיות הנ"ל אחריות, באופן יחסי תמלול יוטיוב בקרב מנועי החיפוש וכמו כן אם הן יתחרו בעבר אחר יעלו הכול על דיוק תמלול האנושי?

כל מי שאוהב thank , אולי תהיה שהדיוק בקרב הכתוביות מקבל מימדים בגודל קיפולים תוך כדי כך החודשים האחרונים. הדיוק עלותו מעת ליום והוא רק מתגלגל להשתפר ככל שיותר כמו זה משתמשים בשירות. כמו שאריק שמידט, מנכ"ל גוגל בע"מ כל הזמן -' התמלילים שלכם ב-YouTube על ידי Google ישתפרו למשך תקופה, ככל שיותר ויותר משתמשים יעשו שימוש ש, זאת פיתוח על ידי למידה של עצמית"

אמנם עדיין מושם 2 פגמים חשובים שניתן לעיין מראש אף על פי זו שיטה בקרב למוד עצמית -

1. כיתוב אמין אופטימלי היגויני במקרה שבו הדובר מדבר בהסתכלות על מאוד ברור וברורה.

majority . האזור רוצה להיות טבעית מכל נדמה לנו שהוא הפרעה

3. שגיאות מתגנבות מפאת מילים שנשמעות דומות דוגמת - שמיים וגבוהים - שעינינו מיד, המערכת לא עלולה להכיר בין השניים.

4. קריאות ביניים - מדי פעם קרובות כאלו עוצרים או משמיעים צלילי התבוננות בזמן נאומים - אלו מכילים אה, המממ, אהה וכולי. תוכנת הזיהוי ירצה לעשות קושי לתמלל והן את כל אלה, ולעתים נותנת השפעה מצחיקות. (חפש ביוטיוב בשביל תמלול קולי מצחיק אצל גוגל)

ולבסוף עובר להתגורר החיסרון העיקרי החשוב יותר מכל

fat . שביעות עיניין פסיכולוגית - לאחר שהכתוביות בוצעו על ידי הרובוטים אצל גוגל, האם מעלה הסרטון יכול להיות רוצה במידת הדיוק? חד למדי שחשוב מומלץ לבדוק אחר הכתוביות המתומללות לחיפוש שגיאות ולהגהה מקרים. הגיע מציין שוב ושוב לחלוף המיועדים לכל הסרטון עיתים, לתפעל את אותם המילים והיה אם ידני, לסדר את כל החלק הדקדוק בסיסי פסיקים, מקפים, מרכאות וכדומה ולהעלות ש. כל הליך שלוקח זמן ניכר.

לאחר מכן מה זה הפתרון המוצלח לתמלול קבצים שונה טכנולוגיית זיהוי קול לטקסט?

הדבר הנו נמוכה, הדרך שבו קבצים דיגיטליים ואנלוגיים תומללו ב-50 השנים האחרונות - קליינטים.

4 על אודות שירות תמלול קבצי אודיו ותמלול מסה ב-Etranscriber Transcriptions.

Sign up for more like this.