יש לי בוט user:dafna3.bot

  • דוגמא לאינטויקילינק

שם הצבע נקרא על שם קרב מגנטה.


מייל מכחלון עריכה

כללי

  • הוספת תבנית שהות אוטומטית לערכים שאינם עומדים בדרישות המזעריות.
  • האם יש לנו בוטים למניעת השחתות? כלומר, זהוי של עריכות שהן בסבירות גבוהה השחתות וסמונן עבורך. אפשר לחפש עריכות שהן מחיקות גדולות, לחפש מלים מתוך רשימה קבועה (קללות וכד'), אפשר לודא שרב העריכה עוברת בדיקת איות, וכד'. (להריץ בוט השחתות על ערכים קיימים)
  • אם כבר קים בוט לזהוי עריכות, אפשר להריץ אותו על הערכים הקימים. למשל, להריץ על כלל הערכים שהעורך האחרון בהן היה אלמוני, ולבדוק את העריכה האחרונה שנעשתה.
  • האם יש לנו בוט למציאת קשורים שבורים? ישנם כמה אתרים ששנו את כתבתם (כמו אתר האקדמיה ללשון), ואולי אפשר גם לתקן חלק מהקשורים אוטומטית.
  • אולי כדאי לחפש ולתקן תבניות שיבאנו מויקיפדיה? אפשר למשל לחפש תבניות המכילות קשורים לדפים בויקיפדיה. בענין זה, אולי כדאי להסיר את כל המועדים הלאמיים בתבנית {{חגי ישראל ומועדיו}}...
  • בזמנו כתב לנו משתמש:Ourielw על רשימות שהוא פרסם באתר

http://lists.wiki.co.il/index.php/%D7%A2%D7%9E%D7%95%D7%93_%D7%A8%D7%90%D7%A9%D7%99 לדעתי, אפשר להשתמש בערכים כדי ליצור רשימות בטויים חסרים במיזם, וכן ליצירת קטגוריות אוטומטית (שחלק מהערכים בהן חסרים).

מכאן ואילך, רשימת פעלות שבוטים יכולים אולי לבצע, בְּחֲלֻקָּה לסעיפי הערך.

כותרת הערך

  • זהוי ערכים שאינם מתחילים בכותרת.
  • ודוא תבנית קבועה לכותרת הערך: מחרזת מלים מנקדות; לאחריהן אפשריות סוגריים הנפתחות במחרוזת "גם: "; בסוף הכותרת תתכן תבנית {{משני}} ובה אות עברית יחידה (לדעתי, עדיף להגביל את הפרמטרים האפשריים ב{{משני}} לטוח הערכים "א"־"ו" לדגמה).
  • ודוא שערכים הומונימיים באים בזה אחר זה בלי הומוגרפים אחרים ביניהם (שלא כמו בדף נקב)

הגדרה + רובד ומשלב

  • כאשר מופיע רבד בסעיף הגזרון וישנה הגדרה יחידה בערך - הוספה אוטומטית של הרבד לפני ההגדרה (ואולי גם הסרתו מהגזרון).(לשון מקרא, חזל, ימי בניים, חדשה) -
  • הוספה אוטומטית של נרדפות וניגודים המופיעים בהגדרה לסעיפי האגרון המתאימים (בוט מאתגר מעט). לחלופין, אפשר להוסיף אוטומטית קשורים פנימיים לערכים אלו.
  • מציאת "הגדרות הדדיות" - שני ערכים המפנים זה לזה בהגדרתם. -
  • מציאת ערכים זואולוגיים ובוטניים חסרי תמונה. - רצוי תמונה
  • סדור ההגדרות - מניעת הגדרות מרבד קדום לאחר הגדרות מרבד חדש יותר, למעט הגדרות במשלב ארכאי/מליצי וכד'.
  • לבדוק שמספור ההגדרות תקין ורציף (גם כשיש הגדרה יחידה). כותבים מתחילים נוטים לעתים להוסיף משפטים מדגימים ברצף לאחר כל ההגדרות, ואולי כדאי לחפש שגיאה מסוג זה.

משפטים מדגימים

  • להוסיף אוטומטית תבנית {{צט}} מתאימה עבור כל קשור מהמקורות (הבוט צריך לזהות את שם הספר/המסכת וליצור הפניה). אפשר גם להוסיף תבנית {{צטבי}} במשפטים המפנים לאתר בן־יהודה או תבנית {{מקור/אינטרנט}} עבור רשימת אתרים קבועים (ynet וכד'). בנוסף, תוכל לחפש באמצעות בוט אתרים הַמְּקֻשָּרִים מערכים רבים, וליצור עבורם תבנית.
  • בהקשר זה, סדור צטוטים אוטומטי כשאפשר: מקרא לפני תלמוד לפני פרויקט בן־יהודה לפני משפטים מהרשת. משפטים בלא מקור (=שהמציא כותב הערך) אחרונים.
  • בוט מאתגר: הדגשת שם הערך במשפטים בהם אף מלה אינה מדגשת. אפשר להסתפק בתוצאות חלקיות (לא תמיד מוצאים את המלה), אך לא כדאי לשנות הדגשות שבצע המחבר. - דוגמה - דוגגמאות, מלגה - מלגות
  • בוט מאתגר: הוספה אוטומטית של קשורים לויקיפדיה משם המחבר/המתרגם (הבוט יודא כמובן שהערך קים בויקיפדיה). - דוגמה - (כמו "יוסי גמזו" בערך נער
  • אם תרצה - אחידות בתבנית המשמשות לצטוט ({{ציטוט}}, {{הדגשה}} וכד'). למשל, אחידות בהוספת מרכאות או בפרמטרים אחרים.
  • אפשר: בוט לבדיקת מספר מרבי של משפטים מדגימים (אולי: לאחדו עם הבוט למספר הצטוטים המזערי).

נתוח דקדוקי

  • כתיב מלא - קשה לחשב אותו מתוך הכתיב החסר, אבל אפשר לודא שהוא זהה לכתיב החסר, למעט ו"וין/יו"דין האפשריים במספר מקומות מצמצם.
  • את ההגיה אפשר אולי לחשב ממש, ו(לפחות )להציעה כבררת־מחדל לשדה התעתיק.
  • בזמנו כתבנו בערכים "צרף"/"צרוף" וכד' בסעיף "חלק דיבר" במקום ב"דרך תצורה". אפשר לתקן זאת באמצעות בוט.
  • אולי תרצה להוסיף אוטומטית קטגוריה לערכים המשמשים בכמה תפקידים בו־זמנית - כלומר, מופיעים כמה אפשרויות בסעיף "חלק דיבר".
  • בשרש צריך לסמן שי"ן שמאלית/ימנית; צריך לודא שאותיות מנצפ"ך סופיות.
  • בנוסף, אפשר להוסיף בדפי התחזוקה ערכים המפנים לדפי פצול שרשים הומונימיים במקום לדף השרש עצמו (לדגמה, הערך חלילן מפנה לשרש "ח־ל־ל" אך אמור להפנות לשרש "ח־ל־ל ג" (ראה חליל)).
  • אפשר ליצור בוט שמחפש אי־התאמות לכללי הנתוח הדקדוקי, בהתאם לדפי המדיניות. לדגמה: סימני נקוד בכתיב המלא, העדר הטעמה בתעתיק, קשורים פנימיים/חיצוניים שנוספו באחד השדות, ערכים שהן מלים שאולות אך צוין בהן שרש, וכד'.
  • עבור רב השדות (חלק דיבר, מין, שרש, דרך תצורה, נטיות) קבענו תבניות קבועות, ואפשר להעביר את התכן הקים בערכים לתבניות אלו באמצעות בוט.
  • אולי תרצה לודא בתבנית {{ניתוח דקדוקי לפועל}} שהבנין הוא אחד מבין 7 הבנינים הידועים. כנ"ל לגבי גזרה.
  • תזכרת: רצית להסתיר את השדה "מין" בערכי תארים/תה"פ/מיליות/כנויים.

גזרון

  • בוט מאתגר: ישנו תדיר מידע על שרשים מקבילים בשפות אחרות בדפי פעלים (ושמות), ואולי כדאי להעבירו לדפי השרשים. בזמנו רונית הציעה משהו דומה.
  • אולי: יצירת קטגורית תחזוקה לערכים בעלי גזרון לא קצר (נניח, מעל 2 שורות) שאינם מפנים להערות שוליים.

סעיפי קשורים פנימיים (נרדפות/נגודים/נגזרות/צרופים/ראו גם)

  • תקון קשורים פנימיים עם נקוד, והחלפת בקשור מדיק.
  • תבנית אחידה לסעיפי הקשורים: כל קשור בשורה נפרדת (עם סימן "*"), בלא טקסט נוסף לאחריו (ראה: לשון). סדור הקשורים לפי סדר א"ב.
  • סדור אוטומטי של הקשורים בעמודות לפי מספר הקשורים.
  • המנעות מכפילות קשורים בסעיפים שונים.


קשורים חיצוניים

  • תבנית {{הזירה הלשונית - מילים}} מקשרת ערכים לדף מתאים במדור "ספורי מלים" באתר הזירה הלשונית. אולי כדאי (?) לסרוק את כלל המלים שישנן במדור זה ולקשר אליהן אוטומטית מהערכים המתאימים. יתכן שהבעיה אינה פשוטה אם אין במדור את הכתיב המנקד. ישנם גם מדורים אחרים ברשת, כגון מדור "מלים וגלגוליהן" באתר האקדמיה ללשון העברית.

תרגום

  • סמון ערכים שהתרגום לאנגלית שלהם אינו קים בויקימלון האנגלי (כדי להמנע מתרגומי גוגל).
  • האם אנו מודאים שאין אות רישית בתחלת התרגום, למעט תרגומים לגרמנית וללוקסמבורגית? כמו־כן, צריך לודא שתרגום שמות פרטיים מתחיל באות רישית (המידע אמור להופיע בסעיף הנתוח הדקדוקי).
  • בכמה ערכים הוסיפו תעתיק לסעיפי התרגום (ראה מים, מחלה). אולי כדאי להסיר/להסתיר/להסדיר את התוספות האלו באמצעות בוט.

הערות שולים

  • כרגע הפניות למקורות המדע מופיעות לעתים בהערות השולים ולעתים בסעיף הסמוכין. האם ישנה מדיניות בענין? אם כן, אפשר אולי לאכפה באמצעות בוט.

בוט - שינוי המיזם מהתשתית - 100,000 ערכיות - המון דפי פירשונים, ויהיו לי הרבה קישורים שאני לא אדע לאן לקשר , לעשות על תת קבוצה של 1000 ערכים בצד


















































בעברית קשה למצוא. נסי במילון אבן שושן או מילון בן יהודה. יש מילון אטימולוגי אחד של ארנסט קליין אבל הוא לא מושלם. Online Etymology Dictionary This is a map of the wheel-ruts of modern English. Etymologies are not definitions; they're explanations of what our words meant and how they sounded 600 or 2,000 years ago. ETYMONLINE.COM Unlike · Reply
· 4 · July 28 at 8:47pm
רותי קליין עורכת לשון
רותי קליין עורכת לשון
יו! לסבא שלי קראו ארנסט קליין :)
Unlike · Reply
· 2 · July 29 at 1:27am
רותי קליין עורכת לשון
רותי קליין עורכת לשון
חוצמיזה תשאלי את אימא שלך, לא?
Like · Reply

· July 30 at 3:47pm

Dafna Hirschfeld

Write a reply...
Choose File
Jonathan Howard
Jonathan Howard
תשאלי פה. ;)
Like · Reply · 1 · July 28 at 9:03pm
Chagit Goldberg
Chagit Goldberg
ראיתי גם בויקיפדיה.
Like · Reply · 1 · July 29 at 1:55am
Batia Solsky
Batia Solsky
נסי אצל @שלום אורן, מחבר ספרי אטימולוגיה
Like · Reply · 2 · July 29 at 4:50pm
משה פלאם
משה פלאם
אצלי בויקעברית - ב'פסודו של יום'. http://he.wikivrit.wikia.com/wiki/pesudo


בויקימילון לגרסה "רשמית" של אטימולוגיה ידועה...See More
Pesudo
פסודו של יום - אוסף מאמרים מעניינים על השפה האנושית והעברית ותולדותיהם אלףבית - על סדר האותיות ומשמעותן המקורית, שמות החודשים - על לוח גזר ושבעת המינים, הבלתי צפוי - קשרים והקשרים של מספרים ושמותיהם בעברית ובלועזית,, שיר עזר, מקורות של מילים בצלילים
HE.WIKIVRIT.WIKIA.COM
Like · Reply · July 29 at 5:53pm
Vered Dayan
Vered Dayan
בספר "מילה ברגע" של ד"ר מרדכי רוזן. יש בו כ-2000 מילים
Like · Reply · July 29 at 6:03pm
Elon Gilad
Elon Gilad
את המילון האטימולוגי של קליין ניתן להוריד כאן https://archive.org/.../AComprehensiveEtymologicalDiction...
אם כי האטימולוגיות שלו לקוניות.

A Comprehensive Etymological Dictionary Of The Hebrew Language Ernest Klein 1987…
ARCHIVE.ORG
Like · Reply · 1 · July 29 at 8:50pm
Lishai Zehavi
Lishai Zehavi
לקסיקון מקורות המילים / ד"ר מרדכי רוזן (הוצ' רכס אקדמי)
Like · Reply · July 29 at 10:04pm
Adam Lloyd
Adam Lloyd
בעברית מקראית Hebrew and Aramaic Lexicon of the Old Testament (HALOT) נותן אטימולוגיה מקוצרת, ומקור נוסף שנותן סקירה רחבה יותר, אך בעל מלאי מילים מוגבל נקרא Theological Dictionary of the Old Testament הערכים שם ארוכים ובכל ערך יש סעיף של אטימולוגיה
Like · Reply · July 29 at 10:16pm
Elon Gilad
Elon Gilad
אחד המגיבים מעל, חובבן בעל אתר קטנטן של אטימולוגיות עממיות והצעות לתרגומים עבריים ללעזים, הציג את רשימת מקורותיו אותה הפטיר בטורי "מהשפה פנימה" שהוא הציג במלים "בעיתון הארץ אם מדובר במילים או ביטויים פוגעניים, גסים או בעלי הקשר מיני, בשיחדש, או בדיון ע...See More Like · Reply · 3 · July 30 at 1:59am
Elon Gilad
Elon Gilad
כשאני חוקר אטימולוגיה של מילה ואני עושה זאת כל יום. אני מתחיל במלון בן יהודה. הוא מדעי, מפורט ומציג הפניות יותר מכל מקור מידע אחר לעברית. אחר כך אני בודק את ארנסט קליין שאולי יודע על משהו חדיש יותר אבל הוא קצרצר (המילונים האטימולוגים האחרים לעברית אינם רציניים ואינם מפנים למקורות או נותנים הפניות וצטוטים של שימוש). אם מדובר במילה מקראית אני בודק במילונים: BDB, HALOT, וה- Theological Dictionary of the Old Testament. חוץ מזה אני עורך חיפושים בספרות האקדמית בעברית, אנגלית ושפות נוספות - בעיקר באמצעות JSTOR וגוגל בוקס אך גם בספריה האוניברסיטאית בספרים מיוחדים לנושאים ספציפים וקורא מה שנכתב על המילה באקדמיה. חוץ מזה אני כמובן קורא גם מה שכתוב בויקיפדיה וויקימילון כמו גם אתרים תורניים שונים אך על אלו אני לא מסתמך ללא בדיקת ההפניה בעצמי. חוץ מזה אני גם מחפש מופעים של המילים שאני חוקר בכל רבדי השפה בה היא נמצאת, בין היתר כדי לבחון את משמעותה בזמן נתון וגם כדי לראות מתי נכנסה או יצאה משימוש. זו פעולה מסובכת המצריכה חיפוש במסדי נתונים וספרים רבים: מאגרים של האקדמיה ללשון העברית, מאגר השו"ת של בר-אילן, גוגל בוקס, חיפוש גוגל לפי שנים, מאגר העתונות ההיסטורית ועוד לפי העניין והתקופה. אני גם בודק מילה במילונים לאורך ההיסטוריה לראות אם המילה מתועדת שם ואיך היא הובנה בזמן נתון. אלו כוללים בין היתר את: רס"ג, רד"ק, הערוך, אוצר השורשים של בן-זאב, המילונים השונים של בן-יהודה, של גור, ושל אבן-שושן, וכמובן בכנעני, ספיר, רב-מילים ומילון הסלנג של רוביק רוזנטל. בכל המקורות הללו יש גם טעויות כפי שגם יש בטורי ולכן צריך לבדוק גם את טענותיהם בדבר אטימולוגיה ולא לקחת את קביעותיהם כתורה מסיני. כשמילה מגיעה משפות אחרות הדבר מצריך כמובן מקורות נוספים - לאנגלית אני משתמש ב-OED כמקור המרכזי והסמכותי - הוא לא פתוח לקהל הרחב. לצרפתית יש מילון של אקדמיה הצרפתית ברשת ולשפות אחרות לפי העניין יש מקורות נוספים. כפי שניתן כדי לחקור אטימולוגיה של מילה באופן רציני צריך להשקיע ימים ולפעמים שבועות וחודשים. Unlike · Reply · 8 · July 30 at 2:30am
Noel Dunsky
Noel Dunsky
ואו תודה על ההפניות...😎😎