OCR לטפסים בעברית
מאומת94/100חילוץ נתונים מטפסי ממשלה ישראליים עם OCR: טאבו, רשות המסים, ביטוח לאומי ועוד
ציון אמינות 94/100 (מאומת) · 85+ התקנות · 2 תורמים ב-GitHub · רישיון MIT
טפסים ממשלתיים בישראל עדיין מגיעים בכמות גדולה כסריקות וכ-PDF לא מובנים, עם כתב יד, חותמות ועברית דחוסה. כלי OCR רגילים מתקשים עם עברית בגלל כיוון הכתיבה, תווים דומים וסריקות באיכות ירודה. התוצאה היא הקלדה ידנית שגוזלת שעות ומייצרת שגיאות.
npx skills-il add skills-il/localization --skill hebrew-ocr-forms -a claude-codeהתקנה דרך Claude.ai, Claude Desktop, ChatGPT, Manus ופלטפורמות נוספות
- 1. לחצו "הורדת ZIP" להורדת קבצי הסקיל.
- 2. פתחו את Claude Desktop ולכו ל-Customize > Skills.
- 3. לחצו על "+" ובחרו "Upload a skill", ואז העלו את קובץ ה-ZIP.
- 4. פתחו שיחה חדשה. הסקיל יופעל אוטומטית כשהנושא רלוונטי.
מתי להשתמש
- כשצריך לחלץ נתונים מסריקות של טפסים ישראליים (נסח טאבו, טופס 106, אישור ניכוי)
- כשמעבדים אצווה של PDF-ים או של תמונות של מסמכי ממשלה בעברית, כולל PDF רב-עמודים
- כשצריך לזהות מספר עוסק, ת.ז., או גוש/חלקה מטקסט מודפס
- כשבוחרים מנוע OCR לעברית (Tesseract מקומי מול Cloud Vision מול Claude Vision)
- כשצריך לאמת שדות שחולצו (ת.ז. עם ספרת ביקורת, פורמט תאריך)
נסו את הפרומפטים האלה
איך סורקים טופס 106 של מס הכנסה ומחלצים ממנו את הנתונים: שכר, מס שנוכה וניכויים, למבנה JSON?
איך מחלצים נתונים מנסח טאבו סרוק? אני צריך לקבל בעלי הנכס, גוש וחלקה, שעבודים ורישומים.
איך מאמתים שמסמך ממשלתי סרוק (כמו תעודת זהות או רישיון עסק) הוא אותנטי ושהנתונים שחולצו ממנו נכונים?
שאלות נפוצות
סקילס קשורים
מדריך לשימוש במודלי NLP לעברית כולל DictaLM 3.0, DictaBERT, NeoDictaBERT, AlephBERT ו-ivrit.ai. השתמשו כשהמשתמש שואל על עיבוד טקסט בעברית, טוקניזציה, זיהוי ישויות (NER), ניתוח סנטימנט, דיבור-לטקסט בעברית, או כשצריך לעבד טקסט עברי בקוד. מכסה בחירת מודל, עיבוד מקדים ואתגרים ייחודיים לעברית (ניקוד, מורפולוגיה עשירה, אותיות סופיות, חוסר באותיות גדולות). אל תשתמשו ל-NLP בערבית (כלים אחרים) או למשימות NLP כלליות באנגלית.
בונים ספריות רכיבי UI ומערכות עיצוב RTL-first לאפליקציות ישראליות עם טיפוגרפיה עברית. השתמשו כשהמשתמש שואל על רכיבי UI בעברית, "עיצוב", "itzuv", מערכת עיצוב ישראלית, זיווג גופנים בעברית, ספריית רכיבים RTL, "tipografia ivrit", או תבניות עיצוב gov.il. מכסה ארכיטקטורת רכיבים RTL-first, זיווגי גופנים עבריים (Heebo+Inter, Rubik+Source Sans Pro), תבניות עיצוב gov.il, מוסכמות פורמט ישראליות (שקל, תאריכים DD/MM/YYYY, שעון 24 שעות) ו-UI מתאים תרבותית למשתמשים ישראלים. לא להשתמש לסוגיות CSS RTL כלליות (השתמשו ב-hebrew-rtl-best-practices) או לבדיקות נגישות (השתמשו ב-israeli-accessibility-compliance במקום).
בניית פריסות RTL (ימין לשמאל) לאפליקציות ווב ומובייל בעברית. השתמשו כשהמשתמש שואל על פריסת RTL, כיוון טקסט עברי, טקסט דו-כיווני (bidi), CSS עברי, או כשצריך לבנות ממשק בעברית. מכסה תכונות CSS לוגיות, Tailwind RTL, הגדרת React/Next.js ל-RTL, טיפוגרפיה עברית ובחירת גופנים. אל תשתמשו ל-RTL בערבית (טיפוגרפיה שונה) אלא אם המשתמש מבקש במפורש דפוסי RTL משותפים.
השימוש על אחריותכם בלבד. תנאי שימוש · אבטחה
רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל