מה ההבדל בין ivrit.ai ל-Dicta?

ivrit.ai מתמקדת בדיבור עברי: קורפוסי אודיו גדולים, מודלי ASR מבוססי Whisper, ו-diarization. Dicta מתמקדת ב-NLP עברי לטקסט: LLM (משפחת DictaLM 3.0), BERT (משפחת DictaBERT), benchmarks. שניהם ארגונים ישראליים מובילים, משלימים ולא מתחרים.

האם אני יכול להשתמש בנתוני ivrit.ai למוצר מסחרי?

כן. ivrit.ai מציבה באופן מפורש את הרישיון שלה כמתיר שימוש מסחרי. זו משימתם: לאפשר תמיכה מסחרית ב-AI עברי. תמיד אשרו עם ה-dataset card הספציפי ובדקו ייחוס.

למה HeQ מקבל ב-HuggingFace ID של pig4431 ולא של NNLP-IL?

pig4431/HeQ_v1 הוא mirror תחזוקה-קהילתית של HuggingFace. המקור הקנוני הוא NNLP-IL/Hebrew-Question-Answering-Dataset ב-GitHub. השתמשו ב-HuggingFace ID לטעינה אבל ציטטו את העבודה המקורית של Cohen et al. EMNLP 2023.

האם DictaLM 24B ו-DictaLM 12B שייכים לאותו רישיון?

לא. DictaLM-3.0-24B נגזר מ-Mistral-Small-3.1 (רישיון Mistral), ו-DictaLM-3.0-Nemotron-12B נגזר מ-NVIDIA Nemotron Nano V2 (רישיון NVIDIA). בנוסף Dicta יש להם רישיון משלהם על העבודה הנגזרת. קראו את שניהם לפני שימוש מסחרי.

האם אני יכול לאמן מודל עברי על נתוני יידיש?

לא בלי תכנון מפורש של העברת שפה. יידיש ועברית חולקות אלפבית אבל הן שפות שונות עם אוצר מילים, דקדוק, ומורפולוגיה שונים. ivrit.ai מתחזקת מודלי yi-whisper נפרדים לעברית וליידיש בדיוק בגלל הסיבה הזאת.

ניווט במאגרי ML עבריים

מאומת91/100

לפני שמחליטים האם להתקין, צ׳אט חי עם סקיל

נווטו את הנוף המפוצל של מאגרי ML ומודלים בעברית וביידיש: ivrit.ai (יותר מ-22 אלף שעות אודיו עברי, מודלי ASR של whisper-large-v3, מודלי יידיש), Dicta (משפחת DictaLM 3.0, וריאנטים של DictaBERT, HeQ), התכנית הלאומית ל-NLP (HebrewSentiment, HebNLI), AlephBERT, ומליאות הכנסת. עוזר לחוקרים ומהנדסי ML לבחור את הדאטהסט הנכון לפי משימה, רישיון (מסחרי או מחקר), כיסוי רגיסטר עברי, והתאמת דאטהסט למודל. השתמשו כשבוחרים נתוני אימון לפרויקט NLP או ASR עברי, מוודאים תאימות רישיון למוצר מסחרי, מחפשים baseline למשימה עברית, או בודקים משאבי ML ליידיש. אל תשתמשו למאגרי NLP ערבי, חיפוש כללי ב-HuggingFace Hub, או בחירת דאטהסט OCR עברי (hebrew-ocr-forms).

הבעיה

קהילת ה-ML הישראלית חזקה לגודלה, אבל המאגרים והמודלים מפוזרים. ivrit.ai מפרסמת קורפוסי דיבור עברי ברמה עולמית בארגון HuggingFace אחד, Dicta מפרסמת מודלי LLM ו-BERT עבריים בארגון אחר, התכנית הלאומית ל-NLP מתחזקת בנצ'מרקים תחת HebArabNlpProject. הרישיונות משתנים מידידותי-מסחרי-מלא עד מחקר-בלבד. חוקר שמנסה לבחור את השילוב הנכון ל-fine-tuning של סיווג סנטימנט על צ'אט תמיכה עברי למוצר מסחרי צריך לחפש בחמישה ארגונים ולקרוא כל dataset card.

skills-il כלי פיתוח|7התקנות970צפיות

0כתיבת ביקורת

1.0.2MITGitHub

7התקנות970צפיות

0כתיבת ביקורת

עודכן: 10 ביוני 2026|תגיות:datasets ml עברית יידיש huggingface ivrit-ai dicta nnlp-il רישוי ישראל

npx skills-il add skills-il/developer-tools --skill hebrew-ml-datasets-navigator -a claude-code

התקנה דרך Claude.ai, Claude Desktop, ChatGPT, Manus ופלטפורמות נוספות

1. לחצו "הורדת ZIP" להורדת קבצי הסקיל.
2. פתחו את Claude Desktop ולכו ל-Customize > Skills.
3. לחצו על "+" ובחרו "Upload a skill", ואז העלו את קובץ ה-ZIP.
4. פתחו שיחה חדשה. הסקיל יופעל אוטומטית כשהנושא רלוונטי.

יצאה גרסה חדשה? איך מעדכנים את הסקיל שהתקנתם

לא בטוחים איך? קראו את המדריך

מתי להשתמש

כשבוחרים נתוני אימון לפרויקט NLP או ASR עברי
כשצריך לוודא שהרישיון של דאטהסט מתאים לשימוש מסחרי
כשמחפשים מודל baseline למשימה ספציפית בעברית
כשבונים stack של תמלול עברי ורוצים לדעת מה ivrit.ai מציעה
כשחוקרים או בונים משהו ביידיש ולא יודעים איפה למצוא משאבים

נסו את הפרומפטים האלה

סיווג סנטימנט מסחרי

אני רוצה לאמן מודל סיווג סנטימנט על צ'אט תמיכת לקוחות בעברית למוצר SaaS מסחרי. איזה דאטהסט להשתמש, איזה מודל התחלתי, ומה הרישיון אומר לגבי ייחוס?

תמלול פודקאסט עברי

אני בונה מוצר תמלול פודקאסטים בעברית. מה ivrit.ai מציעה, איזה מודל ASR להשתמש בפרודקשן עם latency נמוך, ואיך אני מטפל במספר דוברים?

LLM עברי קטן

צריך LLM עברי שרץ על חומרת צרכן (לא יותר מ-16GB VRAM) למוצר עברי. מה Dicta מציעה, מה ההבדלים בין הגדלים, ומה הרישיונות של ה-upstream?

יידיש ML

אני חוקר יידיש ומחפש דאטהסטים ומודלים לזיהוי דיבור ולעיבוד טקסט. מה זמין ב-2026 ומה הרישיונות?

שאלות נפוצות

סקילס קשורים

HyperFrames - שיטות עבודה מומלצות

אמין·88

יוצר: skills-il

v1.0.0

שיטות עבודה להפקת וידאו מקוד עם HyperFrames: קומפוזיציות שהן פשוט HTML + GSAP שמתרנדרות ל-MP4, עם תמיכה מלאה בעברית ו-RTL. הסקיל מסביר איך כותבים קומפוזיציה, מה עושים מאפייני data-* לתזמון, איך עובדים עם ה-Timeline של GSAP ושיטת Layout-Before-Animation, איך מטפלים ב-Visual Identity Gate, איך לטעון פונטים עבריים (Heebo, Rubik, Assistant) בלי `<link>` או `@import`, איפה שמים dir="rtl", איך מפיקים כתוביות עברית עם Whisper ומתמודדים עם קריינות בעברית כש-Kokoro המובנה לא תומך, איך להוסיף אפקטים שמגיבים לאודיו ומעברי סצנות, ואיך לעטוף טקסט מעורב עברית+אנגלית ב-<bdi>. מתאים לבניית תוכן וידאו מבוסס-HTML וסרטוני סושיאל ושיווק בעברית בלי React. לא מתאים ל-Remotion או לעבודת וידאו ב-React, שם השתמשו ב-remotion-best-practices.

צ׳אט חי עם סקיל

0.00910

Claude CodeCursorWindsurf+7

חיבורי Zapier לישראל

מאומת·94

יוצר: skills-il

v2.0.0פופולרי

בונים Zaps שמחברים אפליקציות עסקיות ישראליות (Morning/חשבונית ירוקה, קארדקום, טרנזילה, iCount, Grow) עם שירותים גלובליים לחיוב, תשלום ואוטומציה. כולל טיפול בעברית, פורמט מטבע שקלי, לוגיקת מע"מ דו-חודשית, רפורמת חשבוניות 2026 ויכולות AI של Zapier (Copilot, Agents, MCP). לא מתאים לתהליכי n8n או Make.com.

צ׳אט חי עם סקיל

0.016979

Claude CodeCursorGitHub Copilot+4

JFrog DevOps

אמין·87

יוצר: skills-il

v1.0.2פופולרי

מנהלים חבילות ב-Artifactory וסורקים אבטחה ב-Xray.

צ׳אט חי עם סקיל

0.0121,281

Claude CodeCursorGitHub Copilot+5

מצאתם בעיה בסקיל הזה?

השימוש על אחריותכם בלבד. תנאי שימוש · אבטחה

רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל

ביקורות (0)

אין ביקורות עדיין. כתבו את הביקורת הראשונה!

ניווט במאגרי ML עבריים

מתי להשתמש

נסו את הפרומפטים האלה

פרטים לסוכני AI ולמפתחים

ניתוח אבטחה

ציון איכות

נתוני ביצועים

שאלות נפוצות

מה ההבדל בין ivrit.ai ל-Dicta?

מה ההבדל בין ivrit.ai ל-Dicta?

האם אני יכול להשתמש בנתוני ivrit.ai למוצר מסחרי?

האם אני יכול להשתמש בנתוני ivrit.ai למוצר מסחרי?

למה HeQ מקבל ב-HuggingFace ID של pig4431 ולא של NNLP-IL?

למה HeQ מקבל ב-HuggingFace ID של pig4431 ולא של NNLP-IL?

האם DictaLM 24B ו-DictaLM 12B שייכים לאותו רישיון?

האם DictaLM 24B ו-DictaLM 12B שייכים לאותו רישיון?

האם אני יכול לאמן מודל עברי על נתוני יידיש?

האם אני יכול לאמן מודל עברי על נתוני יידיש?

סקילס קשורים

HyperFrames - שיטות עבודה מומלצות

חיבורי Zapier לישראל

JFrog DevOps

ביקורות (0)