ערכת כלי NLP לעברית
מאומת97/100מדריך לשימוש במודלי NLP לעברית כולל DictaLM 3.0, DictaBERT, NeoDictaBERT, AlephBERT ו-ivrit.ai. השתמשו כשהמשתמש שואל על עיבוד טקסט בעברית, טוקניזציה, זיהוי ישויות (NER), ניתוח סנטימנט, דיבור-לטקסט בעברית, או כשצריך לעבד טקסט עברי בקוד. מכסה בחירת מודל, עיבוד מקדים ואתגרים ייחודיים לעברית (ניקוד, מורפולוגיה עשירה, אותיות סופיות, חוסר באותיות גדולות). אל תשתמשו ל-NLP בערבית (כלים אחרים) או למשימות NLP כלליות באנגלית.
ציון אמינות 97/100 (מאומת) · 301+ התקנות · 2 תורמים ב-GitHub · רישיון MIT
עיבוד שפה טבעית (NLP) לעברית נשאר אתגר טכנולוגי משמעותי. עברית היא שפה מורפולוגית עשירה עם כתיב בלי ניקוד, וזה הופך משימות כמו חילוץ ישויות, ניתוח סנטימנט ותיוג תחבירי למורכבות הרבה יותר מאשר באנגלית. המודלים הזמינים מפוזרים ולא תמיד מתועדים היטב.
npx skills-il add skills-il/localization --skill hebrew-nlp-toolkit -a claude-codeהתקנה דרך Claude.ai, Claude Desktop, ChatGPT, Manus ופלטפורמות נוספות
- 1. לחצו "הורדת ZIP" להורדת קבצי הסקיל.
- 2. פתחו את Claude Desktop ולכו ל-Customize > Skills.
- 3. לחצו על "+" ובחרו "Upload a skill", ואז העלו את קובץ ה-ZIP.
- 4. פתחו שיחה חדשה. הסקיל יופעל אוטומטית כשהנושא רלוונטי.
מתי להשתמש
- כשצריך לעשות טוקניזציה ועיבוד מורפולוגי של טקסט בעברית
- כשעושים Named Entity Recognition (NER) לזיהוי שמות, מקומות וארגונים בעברית
- כשמשתמשים במודלי BERT לעברית כמו DictaBERT או AlephBERT ליצירת embeddings
- כשצריך להחזיר ניקוד לטקסט עברי לא מנוקד (דיאקריטיזציה) עם Nakdan של Dicta
- כשמטפלים באתגרים של המורפולוגיה העברית (בניינים, הטיות, סמיכות)
נסו את הפרומפטים האלה
איך משתמשים ב-DictaBERT לניתוח סנטימנט של טקסטים בעברית? תן דוגמת קוד מלאה ב-Python.
איך עושים זיהוי ישויות (NER) בעברית עם DictaBERT NER? אני רוצה לזהות שמות אנשים, מקומות וארגונים בטקסט.
איך מחזירים ניקוד לטקסט עברי לא מנוקד (דיאקריטיזציה)? תראה לי גם את מודל ה-Nakdan של Dicta וגם את אפשרות ה-API המתארח.
מה הכלים הכי טובים של ivrit.ai להמרת דיבור עברי לטקסט? איך משלבים אותם בפרויקט Python?
שאלות נפוצות
סקילס קשורים
בניית פריסות RTL (ימין לשמאל) לאפליקציות ווב ומובייל בעברית. השתמשו כשהמשתמש שואל על פריסת RTL, כיוון טקסט עברי, טקסט דו-כיווני (bidi), CSS עברי, או כשצריך לבנות ממשק בעברית. מכסה תכונות CSS לוגיות, Tailwind RTL, הגדרת React/Next.js ל-RTL, טיפוגרפיה עברית ובחירת גופנים. אל תשתמשו ל-RTL בערבית (טיפוגרפיה שונה) אלא אם המשתמש מבקש במפורש דפוסי RTL משותפים.
גישה לנתוני לוח שנה עברי וזמני שבת דרך API של Hebcal. שימושי לבניית אפליקציות עם זמני שבת, חגים יהודיים, תאריך עברי או זמנים. מופעל על זמני שבת, Hebcal, לוח שנה עברי, תאריך עברי, זמנים.
מייצרים מסמכים עסקיים מקצועיים בעברית בפורמטים PDF, DOCX ו-PPTX עם תמיכה מלאה ב-RTL וטיפוגרפיה עברית תקינה. השתמשו כשצריך להפיק PDF בעברית, להוציא חשבונית מס, לנסח חוזה, לבנות הצעת מחיר, או להכין מצגת בעברית. מכסה reportlab, WeasyPrint, python-docx ו-pptxgenjs עם תמיכת BiDi. לא מיועד לקריאת מסמכים קיימים או OCR (תשתמשו ב-hebrew-ocr-forms).
השימוש על אחריותכם בלבד. תנאי שימוש · אבטחה
רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל