בינה מלאכותית להורדה בחינם – 9 כלי AI

לכלי הבינה המלאכותית החכמים הללו יכולה להיות השפעה גדולה על ידי שימוש במודלים משוכללים להתמודדות עם משימות תובעניות.

בינה מלאכותית להורדה בחינם – 9 כלי AI בחינם הפועלים באופן מקומי במחשב האישי שלך זה לא מקרי שתוכניות רבות המשתמשות בטכניקות של בינה מלאכותית הן קוד פתוח ולכן חינמיות לחלוטין.

הסיבה לכך היא שהגישות המוקדמות מקורן באקדמיה, שבה רישיונות חינם לתוכנה הם פרקטיקה מקובלת על מנת לקדם שיתוף פעולה ופיתוח נוסף.

עם זאת, כאן לא מדובר במסגרות וספריות לצורות של AI, אלא על יישומים מוחשיים ושימושיים של בינה מלאכותית עבור המחשב שלך. המונח AI מקיף שיטות שונות כמו רשתות עצביות, למידת מכונה, למידה עמוקה או עיבוד שפה טבעית. באוסף הבא, כל הגישות הללו מיוצגות.

הדגמים חשובים

הגישות השונות לזיהוי תבניות, עצי החלטה בעיבוד מכונה ואוטומציה של משימות בנויות על נתוני אימון ומודלים שכבר מוכנים. הזמינות של נתונים אלה היא אחת הסיבות לכך ששיטות AI שימושיות זמינות כיום בכלל בתוכנה זמינה בחינם.

בדרך כלל לוקח שנים לפתח מודלים, ולעתים קרובות יש טרה-בייט של נתונים גולמיים להעריך. אבל עם כוח המחשוב הגובר של חומרת PC נפוצה, פיתוח מודלים של AI וניתוח נתוני אימון הואץ בשנים האחרונות, מה שמאפשר לצוותי מחקר קטנים יותר.

האוסף הבא עוסק ביתרונות המעשיים, כלומר הטמעת שיטות בעיקר בתוכנות חינמיות לחלונות, שמראות היטב עד כמה הטכנולוגיה התקדמה כעת ללא עלויות התקנה גבוהות.

זה גם הודות לפיתוחי קוד פתוח – כי עם Pytorch זמינה מאז 2016 מסגרת למידה עמוקה של פייסבוק ומיקרוסופט, שעשתה לעצמה שם בעיקר במחקר ובפרוייקטים של תוכנה חופשית עם ממשקי ה-API שלה עבור Python ו-C++. גם הטייס האוטומטי של טסלה, בין היתר, מבוסס עליו.

המסגרת הפופולרית והחינמית הגדולה השנייה היא Tensorflow , שמגיעה מגוגל ומספקת כריכה הדוקה לענן של גוגל, אבל גם ספריות רבות לשימוש אישי.

שתי המסגרות הללו הן שהבינה המלאכותית שלהן זורמת בעיקר לתוכניות המוצגות כאן באמצעות חיבור של אלגוריתמים ומודלים של נתונים, או שהייתה מכרעת בפיתוחם.

סופי 2x – הגדלת גדלי תמונה

מוגדל היטב: סופי 2x פועל עם כל מעבד ו-GPU. הכלי עשה את הגרפיקה המפוקסלת הזו (משמאל) פי ארבעה מהגודל (ימין) באמצעות האלגוריתם Waifu 2x.
מוגדל היטב: סופי 2x פועל עם כל מעבד ו-GPU. הגרפיקה המפוקסלת הזו (משמאל) הוגדלה פי ארבעה מגודלה המקורי (מימין) על ידי האלגוריתם Waifu 2x.

IDG

שינוי קנה מידה של גרפיקה של מפת סיביות על ידי הגדלת הפיקסלים שלהם תמיד מוביל לאובדן חמור באיכות. עם Final 2x , הגדלת מפות סיביות לא חייבת להיות הפסדית. התוכנית Final 2x מצליחה לשפר את קנה המידה של הגרפיקה ולהחליק אותה עד הפרט האחרון בעזרת רשתות עצביות והדגמים המסופקים.

עם האלגוריתמים Real Cugan, Real Esrgan, Waifu 2x ו-SRMD, Final 2x מספק ארבע דרכים לשינוי קנה מידה של תמונות לקבלת התוצאות הטובות ביותר. התוכנית יכולה גם לשפר משמעותית תמונות מפוקסלות בפורמט JPG עם רעש וחפצי אמנות חזקים.

התקנה: Final 2x הוא גם בתחילת אוסף הכלים השימושיים שלנו מכיוון שקל מאוד להתקין אותו תחת Windows ואז מיד מזמין אותך להתנסות בהצלחה. אין גם דרישות חומרה מיוחדות, מכיוון שהרשתות והאלגוריתמים הנוירונים המשמשים ב-Final 2x פועלים על שבבי Nvidia, AMD ואינטל. גם GPU משולב מספיק.

עם זאת, כמו בכל כלי הבינה המלאכותית והרשתות העצבית, אותו הדבר חל כאן: הרבה זיכרון RAM עוזר. עבור Windows, המפתח מספק את תוכנית ההתקנה הנוחה Final2x-windows-x64-setup.exe (260 מגה-בייט) בדף Github שלו , אשר משלים את ההתקנה בכמה לחיצות בלבד.

הנה איך זה עובד: לאחר ההפעלה, Final 2x מציג שדה קלט שמקבל את קבצי התמונה בפורמט JPG או PNG שיש לשפר אותם על ידי גרירה ושחרור. לחיצה על סמל גלגל השיניים בפינה השמאלית התחתונה פותחת עמוד עם הגדרות. תחת Device , ניתן לבחור את ה-CPU/GPU לחישוב, אם כמה זמינים.

הדגם קובע את איכות התמונה. האלגוריתם Real-ESRGAN מתאים מאוד לצילומים, בעוד Waifu 2x מתמחה לציורים. גורם קנה המידה נקבע על ידי השדה קנה מידה מותאם אישית . כמו כן, תמיד מומלץ להפעיל את האופציה TTA על מנת לקבל תוצאות משובצות היטב.

 

טרנד בשבילך

בחלון הראשי, התחל מתחיל את החישוב, שיכול לקחת מספר דקות עבור תמונות מורכבות.

Meshroom – סורק תלת מימד לסמארטפונים

ברוכים הבאים לעולם התלת מימד: Meshroom יוצרת רשת תלת מימדית מתצלומים של אובייקטים אמיתיים להמשך עיבוד בתוכנות CAD ומודלים תלת מימדיים כמו בלנדר.
ברוכים הבאים לעולם התלת מימד: Meshroom יוצרת רשת תלת מימדית מתצלומים של אובייקטים אמיתיים להמשך עיבוד בתוכנות CAD ומודלים תלת מימדיים כמו בלנדר.

IDG

סורק תלת מימד סורק אובייקטים אמיתיים בלייזר ויוצר מהנתונים קובץ לשימוש נוסף ב-CAD ובתוכנות אנימציה. מה שנשמע מורכב מאוד אפשרי למעשה בקנה מידה קטן עם סמארטפונים קונבנציונליים או מצלמות דיגיטליות והתוכנה החינמית Meshroom . הוא מבוסס על הספריות הפוטוגרמטריות של המפתחת Alicevision, זמין תחת רישיון קוד פתוח ועבור Windows (64 סיביות). מניתוח סדרות תמונות, הוא מחשב את הצורה של אובייקט מצולם ויוצר קובץ רשת.

התקנה: בגלל ממשק Cuda הנדרש לחישובים, Meshroom דורש כרטיס גרפי של Nvidia עם תמיכה ב-Cuda 2.0 לפחות. הטבלה כאן מראה לאילו קלפים זה חל. למנהלי ההתקן של Cuda מ-Nvidia עבור Microsoft Windows יש גודל הורדה של 3GB.

לאחר הגדרת החומרה של Nvidia, תוכל להתקין את Meshroom (1.3GB). עם כרטיסים גרפיים של AMD ושבבי אינטל, Meshroom פועלת רק במצב הסקיצה הפחות מדויק. בעלי סבלנות לחישובים יכולים לבדוק גרסה חלופית של Meshroom ללא Cuda.

כך עושים זאת: כשמצלמים את האובייקט להסריקה, חשוב שיהיה כמה שיותר מנותק בחדר ריק. יש צורך בעשרות תמונות מכל צד בזוויות שונות עם עומק שדה גבוה וללא טשטוש. חשוב לא להשתמש בגודל תמונה של יותר מ-10 מגה פיקסל. לאחר מכן הקבצים נגררים לאזור התמונות השמאלי ב-Meshroom כדי להתחיל את החישוב, שלוקח כמה שעות אפילו בכרטיסי Nvidia.

לאופטימיזציה נוספת של הרשת, מומלצת לאחר מכן תוכנת תלת מימד כמו התוכנית החינמית Blender .

Kdenlive – מעקב אחר אובייקטים באמצעות AI

מעקב אחר אובייקט: מעקב התנועה "DaSIAM" בגרסאות החדשות של עורך הווידאו עובד עם טכניקות AI ויכול, למשל, להפוך פרצופים לבלתי ניתנים לזיהוי על ידי טשטושם.
מעקב אחר אובייקט: מעקב התנועה "DaSIAM" בגרסאות החדשות יותר של עורך הווידאו עובד עם KITechniques ויכול, למשל, להפוך פרצופים לבלתי ניתנים לזיהוי על ידי טשטוש.

IDG

עורך הווידאו החינמי הזה הצליח להמציא עזרי AI כבר שנתיים. מעקב אחר תנועה, כלומר מעקב אוטומטי אחר אובייקטים בווידאו קליפים, יכול לספק מוטיבים מזוהים עם מסיכה ואז להחיל עליהם אפקטים ממוקדים. זה שימושי, למשל, כדי לפקסל אובייקטים מסוימים בווידאו קליפ.

התקנה: Kdenlive זמין כקוד פתוח עבור Windows ב-64 סיביות כקובץ התקנה (100MB) ולכן מותקן במהירות. בנוסף, כעת מתווספים נתוני המודל עבור אלגוריתם מעקב התנועה. אלו הם שלושה קבצים " dasiamrpn_ kernel_cls1.onnx ", " dasiamrpn_kernel_r1.onnx " ו- " dasiamrpn_model.onnx " ממפתחי Kdenlive. יש למקם את כל שלושת הקבצים בספריית ההתקנה של Kdenlive. לשם כך, הזן את הכתובת %AppData%/kdenlive בשורת הכתובת של סייר Windows וצור תיקיית משנה חדשה בשם opencvmodels. שלושת קבצי הדגם שהורדת ממוקמים שם.

כך זה נעשה: ב-Kdenlive, עוקב התנועה זמין כאפקט. כדי להשתמש בו, מקם קליפ מיובא מהרשימה בפינה השמאלית העליונה בציר הזמן למטה, עבור ללשונית אפקטים בשורת התפריטים האמצעית ובחר שם Alpha, Mask and Keying — Motion Tracker . גרירת האפקט אל הקליפ הרצוי פותחת את ההגדרות של האפקט ומציגה ריבוע אדום בחלון התצוגה המקדימה. בהגדרות, יש לבחור בסוג DaSIAM בתור אלגוריתם Tracker . בציר הזמן, עבור אל המסגרת הראשונה, מקם את מסגרת הבחירה האדומה סביב האובייקט ולאחר מכן לחץ על Analysis כדי לחשב את הפריימים המפתח סביב האובייקט. ניתן לבחור מיידית גם Pixelation , למשל עבור פרצופים.

Spleeter – חיבור מוזיקה לרצועות

מפורק במיומנות: Spleeter הוא כלי שורת פקודה שמשתמש בבינה מלאכותית ובמודלים נרחבים כדי לפרק קבצי מוזיקה בפורמט MP3 לרצועות בודדות עם כלים מבודדים.
מפורק במיומנות: Spleeter הוא כלי שורת פקודה שמשתמש בבינה מלאכותית ובמודלים נרחבים כדי לפרק קבצי מוזיקה בפורמט MP3 לרצועות בודדות עם כלים מבודדים.

IDG

כך הופכים קטעי מוזיקה מוכנים לרצועות בודדות שוב: כלי ה-AI Spleeter זכה לתשומת לב רבה לפני שנתיים לאחר ההצגה הראשונה שלו. זה יכול לחלק מוזיקה בפורמט MP3 לשניים, ארבעה או חמישה רצועות בודדות באמצעות מודלים מאומנים מראש.

Spleeter מזהה קטגוריות כמו שירה, בס, תופים וקטע קצב. כלי שורת הפקודה משתמש בספריית AI Tensorflow כדי לנתח את זרם הנתונים בקטעי מוזיקה ובמקודד Ffmpeg כדי להפריד את הרצועות המבודדות לקבצי MP3 בודדים.

כלי הבינה המלאכותית והכשרת הדגמים מגיעים משירות הסטרימינג הצרפתי Deezer , שהורשה להשתמש בקטלוג הענק והמורשה של מוזיקת ​​פופ כחומר ניתוח לזיהוי תבניות. נתוני הדרכה אלה זמינים גם לשימוש פרטי בחינם, אך יש להתקין אותם בנפרד.

התקנה: הודות לפופולריות שלה, יש גרסת Windows של Spleeter שחוסכת את ההתקנה המייגעת של רכיבי תוכנת Python הבודדים. יציאה קומפקטית זו עבור Windows זמינה דרך מנהל החבילות Chocolately , שממתין תחילה להגדרה. לשם כך, עבור תחילה דרך תפריט התחל ל- Windows Power Shell , שנפתח בלחיצה ימנית ובאפשרות הפעל כמנהל . בשורת פקודה זו, הפקודה:

Set-ExecutionPolicy AllSigned

מאפשר את זכויות הביצוע עם הערך "j". ואז הפקודה:

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))

מתקין את מנהל החבילות של Windows Chocolately.

לאחר מכן מנהל החבילות יכול להתקין את Spleeter ב-Powershell עם הקלט הזה:

choco install spleeter-msvc-exe

כעת יש צורך בהתקנה של דגמי ההדרכה. לשם כך, נעשה שימוש בקובץ האצווה "download_models.bat" בספרייה החדשה שנוצרה "C:\ProgramData\chocolatey\lib\spleeter-msvc-exe\tools\models", הנקראת גם ב-Powershell ומורידות בערך 1.2GB של נתונים – לא עניין של מה בכך. לבסוף, Spleeter דורש התקנה של Visual C++ הניתן להפצה מחדש מ-Microsoft.

כך זה נעשה: לאחר השלמת כל השלבים, תוכל להמשיך ב- Powershell או בשורת הפקודה. השיחה:

spleeter.exe datei.mp3

מפצל קובץ MP3 קיים בספרייה הנוכחית לשירה ולכלים, אותם הוא מציב בתיקייה כקובצי MP3 בודדים. זוהי דוגמה האפליקציה הפשוטה ביותר, שגם לוקחת רק כמה שניות של זמן חישוב במחשב נוכחי עם ביצועים ממוצעים. עם זאת, במוזיקת ​​פופ טיפוסית, Spleeter מזהה רצועות נוספות לבידוד, כגון תופים ובס.

spleeter.exe -m 4stems datei.mp3

בדוגמה זו, Spleeter משתמש בזיהוי הדפוסים שלו כדי לחפש ארבע רצועות בודדות בקטע מוזיקלי, כלומר שירה, בס, תופים וקצב/ליווי. החישוב לוקח קצת יותר זמן עד שהרצועות הללו נכתבות לספריית העבודה כקבצי MP3 בודדים.

הצצה לרצועות שנוצרו בעורך האודיו Audacity: Spleeter עובד בדיוק רב בהפרדת כלים ושירה, אך מנתק תדרים גבוהים.
הצצה לרצועות שנוצרו בעורך האודיו Audacity: Spleeter עובד בדיוק רב בהפרדת כלים ושירה, אך מנתק תדרים גבוהים בתהליך.

IDG

אם ביצירה המוזיקלית שביד יש לליווי תכונה ייחודית להפליא, Spleeter יכול גם להשתמש בפקודה זו כדי לפצל אותה לחמש רצועות, מה שעובד הכי טוב עם שירה, בס, תופים, פסנתר וקטע קצב:

spleeter.exe -m 5stems datei.mp3

פורק במיומנות: Spleeter הוא כלי שורת פקודה שמשתמש בבינה מלאכותית ובמודלים נרחבים כדי לפצל קובצי מוזיקה בפורמט MP3 לרצועות בודדות עם כלים מבודדים.

Microsoft Edge – שפר תמונות

עם מרכזי נתונים משלה מאחוריה, מיקרוסופט עובדת על לצייד תוכניות יומיומיות בכמה שיותר טכניקות AI. מה מועיל בטווח הארוך נותר לראות. ללא ספק, היכולות החדשות של דפדפן האינטרנט Edge לשדרג אוטומטית תמונות ואפילו סרטונים מספקות תוצאות יפות מאוד במסכים ברזולוציה גבוהה.

התקנה: למרות ש-Microsoft Edge כבר מותקן מראש ב-Windows, טכניקות ה-AI של הדפדפן לשיפור תמונה זמינות רק בגרסת המפתחים של Edge. קובץ ההתקנה של גרסת תצוגה מקדימה ציבורית זו של דפדפן Microsoft זמין.

כך זה נעשה: הדפדפן לא מבצע את שיפור התמונה באופן מקומי במחשב שלו, אלא שולח את התמונות לשרתי מיקרוסופט, שם הן מופקרות ונשלחות חזרה לדפדפן. המשמעות היא שמיקרוסופט יודעת ותעריך אילו תמונות המשתמשים מאחזרים באינטרנט. לכן אפשרות AI זו אינה מופעלת כברירת מחדל. במקום זאת, הפונקציה עדיין ממתינה להפעלה בדף האפשרויות מתחת לכתובת edge://settings/privacy/enhanceImages באמצעות המתג המוצג.

שם, ניתן להפעיל פונקציה זו במיוחד עבור אתרים בודדים. רק בגרסאות האלפא של Microsoft Edge שנקראות Canary זמינה פונקציית ה-AI, גם לשיפור סרטונים מטושטשים עד רזולוציית 720p בעזרת GPU משלה. שיטת AI זו ב-Edge דורשת שבבים גרפיים חדשים יותר מ-AMD או Nvidia יחד עם דרייברים קנייניים מתאימים ואינה שולחת את הנתונים לשרתי מיקרוסופט.

Vosk – זיהוי דיבור באמצעות AI

משפה מדוברת לכתוביות: בדוגמה זו, אנו מאפשרים ל-Vosk לזהות את רצועת האודיו של סרטון YouTube בשפה האנגלית בפורמט MP4. התוצאה היא קובץ SRT זה.
משפה מדוברת לכתוביות: בדוגמה זו, אנו מאפשרים ל-Vosk לזהות את רצועת האודיו של סרטון YouTube בשפה האנגלית בפורמט MP4. התוצאה היא קובץ SRT זה.

IDG

מהמילה המדוברת, המוקלטת ועד לתמלול נקי, לא רחוק היום. מסגרת הבינה המלאכותית Vosk , המבוססת על מנוע זיהוי הדיבור Kaldi, היא פרויקט קוד פתוח של אוניברסיטת ג'ונס הופקינס.

התקנה: Vosk דורשת Python 3.11 ב-Windows. במהלך ההתקנה, יש להפעיל את תיבת הסימון הוסף Python ל-PATH . בשורת הפקודה, שתי הפקודות:

pip install ffmpeg
pip install vosk

התקן את התנאים המוקדמים עבור Vosk. לאחר מכן, המקודד/מפענח Ffmpeg נדרש בצורת הקובץ " ffmpeg-git-essentials.7z ". תוכן הארכיון ממוקם בספרייה החדשה שנוצרה "C:Program Filesffmpeg" כך שהקובץ "ffmpeg.exe" ממוקם שם בתיקיית המשנה "bin". כעת יש להוסיף את הנתיב "C:Program Filesffmpeg|bin" למשתנה הסביבה של Windows "Path". ניתן לעשות זאת דרך סמל Windows > הגדרות > מערכת > הגדרות מערכת מתקדמות > משתני סביבה > נתיב > עריכה > חדש .

כך זה נעשה: לאחר מכן עבור אל אתר Github http://github.com/alphacep/vosk-api כדי להוריד כמה סקריפטים לדוגמה תחת Code – Download ZIP , אשר פורקים לכל ספרייה. שם, בתיקיית המשנה "\pythonvosk\transcriber", תמצאו את הסקריפט לדוגמה "transcriber.py". עם השיחה:

vosk-transcriber -l en-us -i test.mp4 -t srt -o englisch.srt

הוא יוצר את קובץ הכתוביות "english.srt" מקובץ הווידאו "test.mp4" על ידי זיהוי דיבור עם חותמות זמן. הסקריפט מוריד אוטומטית מודל שפה מתאים. לאחר מכן ניתן לעבד את הקובץ המוגמר בתוכניות תרגום אחרות לכתוביות בשפה אחרת.

Digikam – זיהוי פנים לתמונות

Digikam מזהה פנים: הנהלת התמונות יוצרת מאגר אנשים מקומי מהתמונות מאוסף התמונות המיובאות ולאחר מכן מאפשרת לתייג ולחפש אנשים.
Digikam מזהה פנים: מתוך התמונות של אוסף התמונות הסרוקות, הנהלת התמונות יוצרת מאגר אנשים מקומי ולאחר מכן מאפשרת תיוג וחיפוש אנשים.

IDG

Digikam , תוכנית לארגון נתמך במסד נתונים של אוספי תמונות גדולים שנמצאת בפיתוח מתמיד כבר יותר מ-15 שנה, פותחה במקור עבור לינוקס ומועברת באופן קבוע ל-Windows. הסיבה לכך היא שהיכולות של Digikam הן ניכרות: בנוסף למיון וסיווג התמונות לפי אלבומים, תגיות ומילות מפתח, ישנן אפשרויות מיון מתקדמות. זיהוי פנים והדירוג האוטומטי של איכות התמונה של הצילומים הם שתי תכונות חדשות יותר של ניהול התמונות המבוססות על AI.

התקנה: Digikam מותקן בקלות ב-Windows עם 64 סיביות באמצעות תוכנית התקנה (114MB). תוכנית ההתקנה מבקשת כמה פרטים עם הגדרות ברירת מחדל הגיוניות עבור ההגדרה. לאחר השיחה הראשונה של Digikam, התוכנית מציעה באופן עצמאי להוריד את נתוני מודל הבינה המלאכותית הנדרשים עבור זיהוי הפנים הכלול, שמסתכם בסביבות עוד 420 מגה-בייט.

כך זה נעשה: Digikam התנסה בזיהוי פנים בתמונות המבוססות על רשתות עצביות מאז גרסה 2.0. אבל רק מאז גרסה 7.2, טכנולוגיית ה-AI הזו הצליחה להוכיח את עצמה בפועל ב-Digikam. לאחר פתיחת תמונה, תצוגת התמונה מציגה סמל של אדם עם סמל פלוס. זה משמש לסימון ידני של פנים עם מלבן בחירה ולתת לו שם.

זה חוזר על עצמו לכמה תמונות נוספות עם האדם, לפיו השם נבחר לאחר מכן מהרשימה המוצגת. לאחר מכן ניתן לחפש את כל אוסף התמונות עבור אותו אדם דרך פריט התפריט חיפוש > אנשים .

חוגין – פנורמות מסדרת תמונות

משלב סדרות תמונות באופן אוטומטי במידה רבה באמצעות זיהוי תבניות: Hugin מחשב נוף או תמונה פנורמית מסדרות של תמונות סמוכות. המחסומים המוצגים כאן יעזרו.
משלב סדרות תמונות באופן אוטומטי על ידי זיהוי תבניות: Hugin מחשב נוף או תמונת פנורמה מסדרות של תמונות שכנות. נקודות הבקרה המוצגות כאן עוזרות בתהליך זה.

IDG

ועוד כלי לתמונות שחוסך שעות רבות של עיבוד תמונה מייגע ומאפשר נופים חדשים לגמרי בצילום נוף. התוכנית Hugin יוצרת תמונות פנורמה מסדרות חופפות של תמונות בודדות. פנורמות מושכות במיוחד בצילום נוף כדי ללכוד מצבי רוח דרמטיים. זה אפשרי גם באפליקציות לסמארטפון כבר כמה שנים. עם זאת, Hugin מאפשר שליטה מדויקת על התוצאה ויכול גם לשלב תמונות בודדות בשורות אנכיות.

התקנה: Hugin היא תוכנת Windows ופשוט צריך לפרוק אותה מארכיון ה-ZIP שלה לכל תיקייה. ניתן למצוא את קובץ ההפעלה כ-hugin.exe בתיקיית המשנה "bin".

כך זה נעשה: Hugin הוא כלי למשתמשים מתקדמים, ואתה לא אמור להיות אובד עצות מניסויים ארוכים עד שכל הפונקציות של התוכנית נחקרו. מומלץ להתחיל עם פנורמות קטנות המורכבות משתי תמונות בודדות שנוספו ללשונית תמונות . לקבלת תוצאות טובות, עליך תמיד להוסיף באופן ידני את אורך המוקד מהמטא נתונים של הצילומים הבודדים. הוספת נקודות בקרה בין תמונות חופפות דרך הכרטיסייה באותו שם משפרות את התוצאה במידה ניכרת.

סינכרון משנה – סנכרון כתוביות

חשב קודי זמן בקבצי כתוביות כדי להתאים לסרטון: Subsync משתמש בזיהוי דיבור באמצעות מודול Python המשולב Pocketsphinx ומנתח את קובץ הווידאו שצוין.
חשב קודי זמן בקבצי כתוביות כדי להתאים לסרטון: Subsync משתמש בזיהוי דיבור באמצעות מודול Python המשולב Pocketsphinx ומנתח את קובץ הווידאו שצוין.

IDG

הסינופילים מעדיפים סרטים וסדרות בגרסה המקורית ללא דיאלוג מדובב. רצועת כתוביות מועילה בכל זאת – ונחוצה בכל מקרה לשפות לא ידועות.

אתרים כמו opensubtitles.org מספקים כתוביות לסדרות וסרטים בפורמטים שנגני מדיה כמו VLC יכולים להתמודד. הקושי כאן הוא לעתים קרובות למצוא קובץ כתוביות מתאים שפועל בסנכרון עם קובץ הווידאו שבהישג יד. אם הכתוביות לא תואמות את המילה המדוברת בסרט, גם ההנאה מהסרט תיפול.

הכלי החינמי Subsync יכול לתקן זאת: עם זיהוי דיבור ובינה מלאכותית, הוא מסנכרן את קובץ הכתוביות עם קובץ וידאו.

התקנה: גם כאן אין צורך בטיולים ארוכים לתוך שורת הפקודה. באתר הפרויקט בכתובת https://github.com/sc0ty/subsync/releases , קיים מתקין וגרסה ניידת לכל גרסאות Windows עם 64 ביט להורדה (חינם, 42MB).

קריאה לקובץ EXE זה מוציאה את התוכנית לתיקיית משנה שבה ניתן למצוא את קובץ התוכנית.

כך זה נעשה: בממשק התוכנית, הנתיב לקובץ הכתוביות בפורמט SRT מוזן בשדה העליון Subtitles , ולידו יש להזין את השפה של קובץ זה. מתחת לזה, השדה References מצפה לקובץ הווידאו, והבחירה שלידו, השפה.

לאחר לחיצה על התחל , Subsync יוריד את קבצי המילון המתאימים עבור השפות הנבחרות, המסתכמים בכמה עשרות מגה-בייט.

לאחר מכן, הסנכרון מתחיל על סמך התאמות שנמצאו, ו-Subsync משכתב את חותמות הזמן של קובץ SRT כדי לעשות זאת

אולי יעניין אותך גם

  • מדריך שחזור הודעות וואטסאפ ללא גיבוי קרא עוד »
  • 5 מחוללי תמונות בינה מלאכותית AI קרא עוד »
  • מדריך צילום מסך אנדרואיד - 3 שיטות עבור כל מכשיר אנדרואיד קרא עוד »
  • מדריך איפוס מכשיר סמסונג נעול - איך לאפס טלפון Samsung קרא עוד »
להראות יותר
Back to top button

זוהה חוסם מודעות

אנא שקול לתמוך בנו על ידי השבתת חוסם המודעות שלך