"הקושי לפתח תמיכה בעברית היה השינוי בכיוון פענוח הטקסט ב-Finereader – מימין לשמאל"

שיחת היום עם יורי קורוטקביץ, מנהל השיווק והמכירות של ABBYY

יורי קורוטקביץ משמש מנהל השיווק והמכירות של ABBYY, חברת ה-OCR שמרכזה במוסקבה, והמעסיקה 650 עובדים. "אנחנו חברה מובילה בתחום. המוצר שלנו תומך בכ-190 שפות, כולל סינית, יפנית, תאילנדית וקירילית. אנחנו עושים שימוש במילונים לאימות ב-38 שפות, כולל מילון עברי", אומר קורוטקביץ. "באחרונה התחלנו בפרויקט לתמיכה בערבית, עקב הביקוש לשפה הזו, שבא דווקא מישראל", הוא אומר ומספר על השקת מוצר זיהוי התווים של החברה בגרסת ה-Desktop עם תמיכה בעברית.

מה מביא אותך לישראל?
"אנחנו מתמחים במוצרי OCR כלומר, זיהוי אופטי של תווים. הסיבה למסיבה הנה השקת המוצר FineReader בגרסת ה-Desktop עם תמיכה בעברית".

האם אתם חדשים בישראל?
"בהחלט לא. אנחנו מוכרים היטב בארץ בקרב המשתמשים הגדולים בטכנולוגיה. המנוע של ABBYY FineReader נמצא בשימוש בכל הארכיונים של העיתונים: מעריב, ידיעות אחרונות, גלובס ויפעת קטעי עיתונות. לקוחות נוספים של המנוע הינם נבו – מאגרים משפטיים, פרויקט בתי המשפט, ארכיון הכנסת ועוד".

איזה פוטנציאל אתה רואה בשוק הישראלי?
"כיום אין, לדעתי, פתרון ברמה ובמחיר שלנו לשוק המשרדי ה-SMB הישראלי. זה מציב בפנינו אתגר של פיתוח השוק וחשיפתו למוצר. המוצר ABBYY FineReader 9 Professional מציע תמיכה בפענוח טקסט עברי – אנגלי משולב והמרה מכל פורמט, כולל PDF,TIFF או GIF, לפורמטים של אופיס ול-PDF. המוצר מתאים לכל משרד בארץ. היקף המכירות השנתי הנוכחי של שוק ה-OCR בישראל מוערך ב-250 אלף דולרים. בשוק פעילים כיום בעיקר שלושה שחקנים: ליגטורה, IRIS ואנחנו. נתח השוק שלנו עולה משנה לשנה".

במה אתם שונים מהמתחרים האחרים בשוק?
"איכות הזיהוי של ABBYY היא מעל 98%, ובזה אנו עולים, לדעתי, על כל המתחרים. התוכנה ידידותית ותומכת בהמרה כמעט של כל פורמט לכל פורמט אחר, והחשוב מכל – מחירה של התוכנה, כאמור, שווה לכל נפש, כרבע מהמחיר שמציעים המתחרים העיקריים. ב-FineReader, משתמש הקצה יכול ללמוד ולהגדיר פונטים מיוחדים, וכן אפשרות להתבצע באצווה, בצורה אוטומאטית ללא נוכחות מפעיל. התמיכה באצווה נעשית על ידי גרסת ה-Corporate".

האם העברית יוצרת אתגרים מיוחדים לטכנולוגיה שלכם?
"הגדרת זיהוי הפונט העברי לתוכנה היה די פשוט. הקושי הגדול יותר היה שינוי כיוון פענוח הטקסט מימין לשמאל, כדי שיתאים לעברית, ופענוח של טקסט משולב הכולל עברית, אנגלית ומספרים, הנכתבים בכיוונים שונים. כדי להגיע לפענוח טקסט עברי באיכות גבוהה משולב במוצר מילון עברי המסייע בזיהוי הטקסט. אגב, המוצר קורא אפילו כתב רש"י, לאחר שהגיעה בקשה לכך מהמגזר הדתי".

מה הלאה בטכנולוגית הזיהוי האופטית?
"אנחנו עובדים כיום על פיתוח תמיכה בערבית ובפרסית, לבקשת השוק הישראלי. כן נעשית בדיקה לאפשרות תמיכה בשפה ההודית, וזאת לבקשת גורמי היי-טק ישראלים. לאחרונה גם שוחרר המוצר ABBYY OCR Recognition Server התומך בעברית. מוצר זה מיועד לפענח כמויות גדולות במיוחד של מסמכים, תוך כדי ניצול משאבי מחשב רבים בעבודה מקבילית".

מי מייצג אתכם בישראל?
"מאגרי תוכנה, בהנהלתו של חיים רון, היא הנציגה הבלעדית שלנו בישראל. ההפצה של המוצרים השולחניים נעשית באמצעות ערוצי הפצה מקומיים, כמו: אזטק, ועיצוב עסקי. יש לנו גם אתר מקומי, שם תוכלו להוריד גרסת התנסות. ניתן גם לקבל תקליטור לניסוי בחברת מאגרי תוכנה".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים