ויקימילון:מזנון/טיפול בהומוגרפים

שימו לב: דף הדיונים ויקימילון:מזנון/כתיב מלא או כתיב חסר עוסק בנושא קרוב, והדיונים בשני הדפים משיקים לעתים. ‏nevuer‏ • שיחה 15:00, 19 באוקטובר 2008 (IST)[תגובה]

טיפול בהומוגרפים עריכה

הועבר מויקימילון:מזנון/ארכיון 6.

לדעתי, אנחנו עושים טעות חמורה בכך שאנחנו מאחדים לדף אחד מילים שונות, שכל "חטאן" הוא שהן נכתבות באופן זהה (הומוגרפים). כשמדובר במילים שגם הניקוד וההגייה שלהן זהים, זה עוד נסבל, אבל כשמדובר במילים שנהגות ומנוקדות באופן שונה, ורק בכתיב חסר-ניקוד הן נראות זהות - זה כבר הופך את החיפוש בוויקימילון לבלתי נסבל. נתקלתי לאחרונה בבעיה כשכתבתי את הערך שור#שׁוּר. אין שום היגיון בצירוף המילים שׁוֹר ושׁוּר לדף אחד. אלה מילים בתפוצה שונה, בשימוש שונה, ברבדי שפה שונים, ומכל בחינה אין ביניהן קשר, למעט העובדה שהן חולקות את המחרוזת ש-ו-ר. לדעתי, צריך להוסיף ניקוד, אפילו ניקוד חלקי, גם בשמות הערכים, וליצור דפי פירושונים מצירוף האותיות הלא-מנוקד. למשל, הצירוף "בור" יפנה לדף פירושונים: בחרו: בוֹר או בוּר. במקרה של "שור", צריכה להיות הפניה אוטומטית ל"פר מסורס" (כיוון שזו המילה הנפוצה יותר), ובראש הערך יש לכתוב "פירושון" (לחץ כאן אם התכוונת ל"שור" במובן "חומה"). דרור_ק 10:36, 16 אפריל 2006 (UTC)

לדעתי זה דוקא יפגע בנוחיות. מה שכן, אפשר להוסיף בראש כל עמוד מעין תוכן עניינים מקוצר ובפונט גדול, שיקפיץ לחלק בעמוד של המילה המבוקשת. כל זה משתי סיבות: (1)ניקוד בשמות הערכים יפגע, לדעתי, בשמישות. ניקוד חלקי יפגע לחלוטין באחידות. (2)אם נאמר שהגולשים באתר מתחלקים ל"מביני דבר" ול-"לא מביני דבר", ממבט ראשון נראה לי שעבור שתי קבוצות אלו עדיף הסידור הנוכחי. לכן, אני בעד תוכן עניינים מקוצר בראש העמוד, אך נגד הפיצול. בברכה, Mintz l 11:19, 16 אפריל 2006 (UTC)
כבר יש תוכן עניינים הנוצר אוטומטית ואין שום סיבה ליצור אחד חדש. אני מסכים עם כל מה שאמר לאון ונותן שוב את זבורית ואת אור כדוגמה מוצלחת לשילוב כזה. גיא 11:27, 16 אפריל 2006 (UTC)
דרור, אינני מבין מדוע זו טעות חמורה. פתח את מילון אב"ש וראה כמה מילים מקובצות תחת אותו עמוד רק משום שהן מתחילות באותן אותיות, קל וחומר כמה מילים מקובצות תחת אותו אשכול משום שהן נכתבות בצורה זהה. לא אנחנו המצאנו את זה.
אריה ז. 13:15, 16 אפריל 2006 (UTC)
מילון אבן-שושן הוא מילון מודפס. הערכים מודפסים בו ברצף, כשכל ערך פותח פסקה חדשה. המקבילה של פסקה אצל אבן-שושן מבחינתנו הוא דף HTML אחד. אבן-שושן היה מוגבל מבחינת כמות הנייר שהוא יכול היה להקצות לעותק אחד, מגבלה שאינה קיימת לגבינו. אף על-פי כן, הוא הקפיד לפתוח פסקה חדשה, כלומר ערך חדש, בכל פעם שבה על-אף הדמיון בצורה, המשמעות שונה לגמרי. במקרים כאלה מופיעה אות סידורית קטנה לפני הערך (א, ב וכו').
מבחינת הנוחיות, אנחנו מקשים מאוד על הקוראים. קורא שנתקל במילה "שׁוּר", ושם לב מן הסתם שאין מדובר ב"שׁוֹר", ייחפש את משמעות המילה אצלנו וייתקל דווקא במילה "שׁוֹר". רק אם הוא יגלול את הדף עד הסוף, הוא יבחין במילה הנוספת, או אם הוא יתעמק בתוכן העניינים, שהוא בדרך-כלל עמוס ממילא (וגם אפשר להסיר אותו לחלוטין ב"העדפות"). יותר מזה - מי שיחפש דווקא את המילה "שׁוֹר" יופתע לגלות משמעות נוספת כביכול "חומה", ועלול לשייך אותה בטעות למילה המופיעה בראש הדף. בפועל מדובר בשתי מילים שונות לחלוטין. הכלל לדעתי צריך להיות כזה: אם הכותב הקליד מילה בלי ניקוד, הוא יופנה לערך הסביר ביותר (מבחינת תפוצת המילה בשפה). במקרה של "שור" ברור שזהו הערך "שׁוֹר" (בחולם). עם זאת, בראש הערך תופיע הערת פרושונים, שתפנה אותו גם לערכים אחרים שנכתבים בצורה זהה בלי ניקוד. אם המילים הן בתפוצה שווה, תהיה הפניה לדף פירושונים מיוחד. אם המשתמש יטרח לנקד, הוא יופנה ישירות לערך שביקש. כלומר, אם הוא יכתוב "שוּר" הוא יופנה מיד לערך המתאים. אני מזכיר לכם, שדווקא תלמידי הכיתות הנמוכות, ותלמידי אולפנים רגילים לנקד, כיוון שכך מלמדים אותם לקרוא בשלבים הראשונים, ולכן דווקא הניקוד נראה די טבעי לאנשים שזקוקים במיוחד למילון. דרור_ק 19:24, 16 אפריל 2006 (UTC)
האם אתה טוען שאבן-שושן, בפנותו להוצאה זו או אחרת, הוגבל בכמות הדפים שהיה יכול לכתוב? קשה לי להאמין שאכן כך התנהלו הדברים. כל עוד אין הוכחה לכך, יש להימנע מהבאת דוגמאות כאלו.
הצעתך, לעניות דעתי, אינה מקלה על הקורא אלא דווקא מסרבלת. בצורה הזו נכפיל (אם לא נשלש) את מספר הדפים הקיימים כאן ללא כל צורך ונעביר כל קורא שלב אחד נוסף בדרך לערך הרצוי. העובדה שאיננו מוגבלים בכמות הדפים אינה משכנעת (לפחות אותי) שיש לפצל את הערכים. התייחסות אל הקורא הממוצע כאל ילד קטן גם היא לא עוזרת. מי לא גולל דף עד הסוף? מלבד זאת, אם הקורא הוא אכן ילד קטן, הוא לא יחפש מלכתחילה את המילה שׁוּר.
לסיכום, אינני מסכים עם ההצעה משום שהנימוקים שהובאו אינם משכנעים דים.
גיא 21:32, 16 אפריל 2006 (UTC)
בעניין אבן שושן - עיין בבקשה בהקדמה למהדורה המרוכזת שלו. ועוד עניין - שים לב שלא מדובר על פיצול ערכים. ממילא "שוֹר" ו"שוּר", וכן "בוֹר" ו"בוּר" הם ערכים שונים לפי כל קריטריון מילונאי (אני מכיר אפילו מילונאים שיאמרו ש"בוּר" נחלק לשני ערכים - אחד בוּר (אדמה) והאחר - בוּר (אדם)). השאלה היא אם יש לשים יותר מערך אחד בדף אחד רק משום שכל הערכים האלה נכתבים בצורה זהה בכתיב חסר-ניקוד. דרור_ק 01:12, 19 אפריל 2006 (IDT)
לגבי הניקוד, אולי נוח לקרוא אותו, אך להקליד אותו ממש לא נוח. חוצמזה, ילדים זוכרים ניקוד לפי הצליל ולא נראה לי שיש להם מושג מתי צריך להיות פתח ומתי קמץ. מה שאנחנו עושים כאן בדרך כלל זה לשים את המילה הנפוצה יותר בראש העמוד. Mintz l 14:53, 17 אפריל 2006 (UTC)
אני מסכים לחלוטין עם דרור ק. דף פירשונים ייקל מאוד למצוא את המילה המבוקשת. אמנם יצטרכו עוד קליק, אבל לפחות יראו למה עוברים. לגבי טענת "הילדים לא יודעים ניקוד" - אם נבנה את דפי ההפנייה בצורה נבונה (לדוגמה: ניתן הסבר קצרצר מאוד לגבי פירוש המילה), לא תהיה בעיה לדעת מה המילה אשר מחפשים.

שבירה עריכה

אני חושב שהגענו לשלב המצריך הצבעה. אם לא תהיה התנגדות ביממה הקרובה, נפתח בכזו. גיא 23:07, 18 אפריל 2006 (IDT)

אני אשמח אם תיפתח הצבעה בנושא. דרור_ק 01:12, 19 אפריל 2006 (IDT)


רציתי להעלות כמה נקודות:
  • כאשר עושים חיפוש (לא "עבור") למילה שור, כלל לא מקבלים את הערך שור עצמו אלא "פר" ועוד רשימה קצרה של ערכים לא רלוונטיים. לעומת זאת כאשר מחפשים "פר", מקבלים את "פר" עצמו אך לא מקבלים "שור" למרות ש"פר" מופיע בתוך שור. האם יש משהו דפוק באלגוריתם החיפוש?
  • אמנם לא מן הדוגמאות הטובות, אך נקח למשל את "שב" כמילה עם הרבה פירושים (3 נראה לי). אז אילו דפים ניצור? "שב (בא)", "שב (זקן)", "שב (ישב)", או "שַב", "שׁב", "שֵב" ?? ו"שב" עצמו יהיה דף פירושונים? כלומר כדי לנווט לאן שאתה רוצה, תצטרך להקליד "שב" בתיבת טקסט, לחכות עד שהדף יעלה, ואז לבחור את הפירוש המתאים ולחכות שוב? מילון אמור להיות משהו מהיר, לא מעייף. פיצול יאיט את הניווט וישעמם את הגולשים. והגולשים לא דפוקים. הם יכולים לגלגל עד סוף הדף. הם רואים את זה בתוכן עניינים. ואם הם מנוסים מספיק כדי להסתיר אותו, הם בטוח מנוסים מספיק כדי לגלגל עד הסוף.
  • קחו משימה שיגרתית: ילדים קיבלו ש"ב לחפש במילון את הפירוש למילה "שב". אז כעת הם צריכים לעבור מפירוש לפירוש, להעתיק ולהדביק? אמנם הניקוד והמשמעות שונה, אך מאחר והtypography זהה, מן הראוי שיופיעו באותו עמוד. בפרט כשמדובר במילים מבלבלות כאשר הגולש לא יודע איזה פתגם מתאים לאיזה ערך, כמו למשל ב"שבר": האם "שבור רגל" ו"שבר כלי" זה מאותו מקור? בשביל למנוע בלבול מהסוג הזה, צריך שהכל ירוכז בעמוד אחד.גם "פרח" זו דוגמה טובה: האם "פרח מזכרוני" ו"פרח בר" זה מאותו מקור?
  • כאשר מישהו כבר יודע מה הוא רוצה לחפש (הכוונה לניקוד), חיפוש בתיבת הטקסט עם ניקוד מוביל לערך המבוקש. ואם הוא לא יודע מה הוא מחפש, אז גם סבבה :-)
  • ויקימילונים אחרים, אשר הגיעו לרמה הרב-לשונית, יהיה להם קשה מאוד להתמודד עם הפיצול הזה. הרי יש כאן גם אספקט של גלובליזציה, וחיפוש מקורות מילה בין שפות שונות, לינגוויסטיקה, עיניינים... למה סתם לסבך? לכל המשמעויות השונות של אור בסיס משותף. האם נראה שהויקי האנגלי מתחיל להפריד לדפים שונים את הערך light?? בשום פנים ואופן!
Mintz l 01:51, 19 אפריל 2006 (IDT)
אני מבקש לציין שיש לכתוב "שור" וללחוץ על עבור כדי להגיע אל הערך. גיא 10:13, 19 אפריל 2006 (IDT)
תשובות לכמה נקודות שהעלה Mintz:
  1. ויקימילון כולל ערכים ולא נטיות. לפיכך הנטייה "שֵב", שהיא צורת ציווי של "ישב", כלל לא תופיע בו. ערך פירושו כלל הנטיות הדקדוקיות של מילה בשפה. בעברית משתמשים בצורת עבר נסתר ("ישב") או בצורת ל+מקור ("לשבת") בתור נטיות המייצגות את הערך כולו. ב"מילון ההווה" או ב"מילון ספיר" בחרו להשתמש בצורת בינוני פועל ("יושב"), אם כי אני לא חסיד של השיטה הזאת.
  2. הדוגמה שלך - "שׂב" (=סב, זקן) לעומת "שׁב" ("לשוב") רק ממחישה את האבסורד שבצירופן לדף אחד. ש' ימנית ו-ש' שמאלית הן בעצם אותיות שונות שיוצרות שורשים שונים. נכון אמנם שבמסורת המילונאית העברית לא מבחינים בין ש' ימנית ל-ש' שמאלית לצורך סידור הא"ב, אבל אף מילונאי לא יעלה על דעתו לאחד את השורשים שׁ-ח-ק - שׂ-ח-ק - אלה שורשים שונים שפה"פ שלהן שונה. אגב, גם תלמידי בית הספר היסודי אמורים לדעת את זה, ואם המורים שלהם לא מלמדים אותם, אז מוטב שאנחנו נעשה זאת.
  3. צירופים מקבלים אצלנו דף נפרד - זה יתרון גדול שלנו על פני מילונים כגון מילון אבן שושן. תלמיד שירצה לחפש את "שבר כלי" יקליד את הצירוף כולו, וממנו הוא יקבל הפניה למילה המתאימה שממנה נגזר הצירוף. ועוד משהו - כדי לכתוב מילון צריך להיות בקיאים בשפה העברית, ולהעביר את הרבדים שלה בצורה מדויקת וקומוניקטיבית. "פרח" של "פרח בר" ו"פרח" של "פרח מזכרוני" הן שתי מילים שונות, שבאופן מקרי נראות ונשמעות דומות. הראשונה, מילה עברית מקורית, האחרונה שאילה מארמית (השווה לביטוי: "עורבא פרח" = עורב מעופף). לא זו בלבד שאנחנו צריכים לדעת או לברר את זה כדי לכתוב את הערכים בצורה מדויקת, חשוב שמי שקורא את המילון יבין שמדובר בעצם בשתי מילים שונות. כמובן צריך לעזור לו להגיע לכל מהערכים בצורה נוחה, אבל לא במחיר של הפצת טעויות.
  4. מי שרוצה לתת תרגום לעברית של מילה בשפה אחרת, יעדיף ששתי מילים שפירושיהן שונים לחלוטין יופיעו בדפים שונים. ככה יהיה לו קל יותר להפנות מהדף שלו לפירוש המדויק אצלנו, בלי שימוש בכל מיני סולמיות (# - הפניה לפסקה בדף) וכיוצ"ב. האורתוגרפיה העברית לא עושה את החיים קלים, אבל זו השפה. מי שרוצה לתת תרגום לעברית - יבורך, אבל אין מנוס מלימוד שיטת הניקוד.
דרור_ק 20:26, 19 אפריל 2006 (IDT)
ובכן, כפי שנראה, כל העניין שנוי במחלוקת. מאחר והמילון בשלבו הנוכחי הוא די מצומצם, אני לא חושב שאנחנו יכולים לראות את התמונה המלאה כרגע, מבחינת שימושיות, נוחות, וכו'. לכן לדעתי כדאי, לעת עתה, להמשיך להזין מידע לתוך המילון, וכשנהיה תמימי דעים לגבי העניין, נוכל להתחיל לפצל, כי אם נעשה את זה עכשיו זה יצא מכלל שליטה. סופ"ש נעים לכולם. Mintz l 14:02, 20 אפריל 2006 (IDT)
הערה חשובה נוספת - לעת עתה אנחנו מופיעים ברשימת השפות עם פחות מ-10,000 ערכים, כיוון שרשומים 2,257 ערכים בעברית. בפועל, לפי הקריטריונים ששפות אחרות פועלות לפיהן, יש לנו יותר ערכים (קשה לי להעריך כמה). מישהו מתנדב לכתוב לוויקימדיה ולהסביר להם את זה? דרור_ק 11:26, 22 אפריל 2006 (IDT)

הצבעה: טיפול בהומוגרפים עריכה

הועבר מויקימילון:מזנון/ארכיון 6.

מדיניותו הנוכחית של ויקימילון היא איחוד הומוגרפים (מילים שונות הנכתבות בצורה זהה בכתיב חסר) בדף אחד (ראו אור). המשתמש דרור_ק מבקש לשנות מדיניות זו ולפצל הומוגרפים לדפים שונים ולקשר אליהם מערך מרכזי אחד (בוויקיפדיה ערך זה קרוי "דף פירושונים"). דיון בנושא התקיים לעיל ובעקבותיו מתקיימת הצבעה להלן. משתמשים בעלי ותק של חודש לפחות בוויקימילון רשאים להצביע. לא ניתן יהיה להצביע לאחר 21:00 (לפי שעון ישראל) ביום חמישי, ה-27 באפריל 2006.

בעד פיצול הומוגרפים עריכה

  1. דרור_ק 21:36, 19 אפריל 2006 (IDT)
  2. אמיתי 11:42, 28 אפריל 2006 (IDT)

נגד פיצול הומוגרפים עריכה

  1. גיא 20:51, 19 אפריל 2006 (IDT)
  2. שיר-לי 22:46, 19 אפריל 2006 (IDT)
  3. Mintz l 14:03, 20 אפריל 2006 (IDT)
  4. אריה ז. 15:32, 20 אפריל 2006 (IDT)

לא ניתן להצביע עוד.

פירושונים וכתיב מלא עריכה

הועבר מויקימילון:מזנון. ‏nevuer‏ • שיחה 14:52, 19 באוקטובר 2008 (IST)[תגובה]

עד כמה שראיתי אין משתמשים כאן בדפי פירושונים, כנהוג בוויקיפדיה, ונראה לי שחבל. קראתי במקרה את חתול ונתקלתי לפתע בתחתית הערך בתמונה של חיתול - הייתי בטוח שהדף הושחת עד שראיתי שהוא מכיל מידע גם על חתולים וגם על חיתולים. איזה הצדקה יש לשלב אותם באותו הדף? אני חושב שכדאי לפתוח פירושונים למקרים כאלה. כמובן, בלבול זה לא היה קורה אילו שמות ערכי המילון היו כתובים בכתיב מלא. אני מניח שעל כך כבר נאמר הרבה, אבל אוסיף את שתי הפרוטות שלי: זו מדיניות שמפריעה לשימוש במילון, וכדאי לשנות אותה. Odedee 13:38, 2 באוקטובר 2008 (IDT)[תגובה]

אכן הרבה נאמר על כך, והרבה עוד ייאמר. גם אני סבור ששמות הערכים צריכים להיות בכתיב מלא, אבל זה יכול לחכות. אחרי שנצליח להחזיר את המיזם למסלולו ולשקם את הקהילה, אנסה להחזיר את העניין לסדר היום. ‏nevuer‏ • שיחה 18:22, 2 באוקטובר 2008 (IDT)[תגובה]
תודה, כבר קראתי פעם את הדף ההוא ודעתי אז הייתה כהיום. בכל מקרה, לא רק לעניין הכתיב התייחסתי, אלא לגישה שלפיה מילים שונות בתכלית מוצגות באותו הדף. זו, לדעתי, טעות, ואחת היא אם כותבים בכתיב מלא או לא. גם במילון אבן שושן לא ימצאו הקוראים את חתול ואת חיתול כמשמעויות שונות של אותה המילה - מפני שזו לא אותה המילה. בחיפוש אקראי ראיתי שאותה הגישה ננקטה גם בחמור ובבור למשל. אמנם כאן khamur וגם khamor (או bur וגם bor) נכתבות בכל מקרה באותה הצורה כשאין ניקוד, אך אינני רואה סיבה שידורו באותו הדף, כי אין מדובר במשמעויות שונות של אותה המילה. לא ברור לי האם אלה החריגים, או שזו המדיניות, אבל כך או כך צריך לשנות זאת. Odedee 19:23, 2 באוקטובר 2008 (IDT)[תגובה]
אם כבר העלת את הנושא, מומלץ ואפילו רצוי לפתוח את הנושא מחדש ולעשות הצבעה שלפיה נקבע האם לפתוח דפי פירשונים או לא. ‏Or1219:46, 2 באוקטובר 2008 (IDT)[תגובה]
לא מומלץ ולא נעליים. אין שום סיבה לפתוח הצבעה כשהדיון בקושי החל. וחוץ מזה, מי בדיוק יצביע: אתה, לאון ואני?! ‏nevuer‏ • שיחה 20:18, 2 באוקטובר 2008 (IDT)[תגובה]
אתה יוצא מהמשוואה של "דף אחד = ערך אחד" - יש במשוואה הזאת היגיון רב, אבל היא איננה מובנת מאליה. זה בסופו של דבר עניין של מוסכמות. המוסכמה בוויקימילון (בכל השפות) בעניין זה שונה מוויקיפדיה, ובעבר הוכרע שוויקימילון העברי לא יחרוג ממוסכמה זו. את הנימוקים בעד ונגד תוכל לקרוא כאן. אני לא רואה סיבה ממשית לשנות החלטה זו. העובדה שמספר ערכים מאוגדים באותו דף איננה רומזת על כל קשר ביניהם, למעט העובדה שהם חולקים את אותה מחרוזת אותיות. הערכים השונים בדף הם אוטונומיים לחלוטין מבחינת תוכנם, וההפרדה ביניהם מובהרת בעיצוב הדף. ‏nevuer‏ • שיחה 20:18, 2 באוקטובר 2008 (IDT)[תגובה]
תודה על הקישור - אותו לא הכרתי. אני רואה שכיוונתי לדעת גדולים וטובים... נכתבו שם כמה נימוקים די תמוהים בעד איחוד ההומוגרפים. בניגוד לכתוב שם ("ראה כמה מילים מקובצות תחת אותו עמוד רק משום שהן מתחילות באותן אותיות"), מילון אברהם אבן שושן מפריד את הפירושים להומוגרפים השונים, לפי דרך ניקודם, ובכל אחד מהם ניתנות בנפרד כל הפרשנויות שלו. אכן, באופן טבעי, כולם שוכנים באותו הדף או בסמיכות, אבל יש ביניהם הפרדה מוחלטת. הטענה כי ההומוגרפים מופיעים שם באותו עמוד היא חסרת משמעות - אם הולכים לפיה, לפיה ניתן גם לטעון שצריך לאחד את ספק וספר לאותו הערך, כי גם הם אולי מופיעים באותו עמוד במילון המודפס.
האמירה "העובדה שמספר ערכים מאוגדים באותו דף איננה רומזת על כל קשר ביניהם" איננה טבעית בעיני, שכן מילון אמור לאגד יחד מילים שיש להן אותו שורש, נניח, ולא מילים שאין ביניהן קשר (למעט הכתיב). האם ישנו חיסרון כלשהו בקיום דפי פירושונים? ‏Odedee שיחה 21:42, 2 באוקטובר 2008 (IDT)[תגובה]
לדעתי החסרון המרכזי הוא סרבול מיותר. נראה לי קראנו לזה "מונה הקלקות" - שיקח הרבה זמן עד שמגיעים לאיפה שרוצים. חוצמזה מה יופיע בדפי הפירושונים? ההגדרה (בדומה לתבנית:פירוש נוסף). מה שאני מתכוון הוא שדף פירושונים ייראה למשל כך:
האם התכוונת ל:
  1. בור, חור באדמה, גש לבור (חור באדמה).
  2. בור, אדם חסר השכלה, גש לבור (אדם חסר השכלה).
ובכן לדעתי מבנה שמות שכזה הוא גרוע מאוד. כפי שאני רואה זאת, המחשבה לאחד בדף אחד מקורה בשאלה "מהו הגורם המשותף המתאים ביותר?" - ובכן, שורשים כבר יש בקטגוריות, ו"מחרוזת תווים" כפי שראובן הגדיר זאת הינה בסיס משותף נוח מאוד. Mintz l 01:48, 3 באוקטובר 2008 (IDT)[תגובה]
נכון שמדובר על מעבר בדף מיותר. מנגד, במצב הנוכחי אדם קורא ערך שלם מיותר, עד שהוא מגיע למה שחיפש. וזה במקרה הטוב, כי במקרה הרע, קוראים עלולים בכלל לא להגיע אל הערך המבוקש, כי הוא נחבא בתחתית הדף. אני סבור שיש לבחור ברע במיעוטו, ולדעתי הרע במיעוטו הוא הקלקה נוספת, לא פספוס של משמעות שלמה בדף.
אבל אני חושב שכל זה הוא רק חלק קטן מהתמונה. המהות כאן היא הבעיה, לא מספר ההקלקות. כשערך מטפל בנושאים שאין ביניהם קשר, זה מתכון ליצירת בעיות בלי גבול. ניקח אחת שראיתי כעת, בעיון של רגע: בינוויקי. חתול מקשר לערך על חתול במילון באנגלית, אבל לא לערך על חיתול, diaper, שם (אין משם כרגע קישור למילון בעברית, ויש לי ניחוש למה). אני חושב שבסופו של יום זה יוצר בעיות שאין להן פתרון - לא רק לבוטי בינוויקי שלא יודעים לאיזה דף לקשר, אלא לאנשים שמשתמשים במילון. לא כולם יודעים עברית, לפעמים אפילו ברמה מינימלית. אם יהיה בינוויקי מ-diaper לחתול, זה ממש מכשיל אנשים. אני לפעמים משתמש בבינוויקי רק לדעת כיצד מילה נכתבת בשפה אחרת, בלי להיזקק לאטימולוגיה שלה או למשמעות. לשם כך אני רק עומד עם העכבר על שם השפה כדי לראות את שם הדף בעברית. פה גם יש סגירת מעגל כלשהי עם פתיחת הדיון - מי שעושה כמוני (אני משער שאינני יחיד) עלול להיכשל בענייני הומוגרפים, בגלל הבחירה לא להשתמש בכתיב מלא. ‏Odedee שיחה 01:26, 4 באוקטובר 2008 (IDT)[תגובה]
חשוב להבהיר שהבינוויקי בוויקימילון מבוסס על עיקרון שונה לחלוטין מזה שאתה מכיר מוויקיפדיה. כך למשל, הערך diaper בוויקימילון האנגלי לא אמור לקשר לחיתול כאן, אלא ל-diaper.
יש לכך סיבה מהותית, ולפי דבריך אני לא בטוח שאתה מודע לה (ואם כן - סליחה על אי-ההבנה): ויקימילון הוא מיזם רב-לשוני, לא רק במובן זה שהוא (אמור להיות) קיים בכל שפה (כמו ויקיפדיה), אלא גם שבכל שפה הוא מילון רב-לשוני, עד כמה שזה עשוי להישמע מוזר. כלומר, ויקימילון האנגלי למשל הוא מילון אנגלי-אנגלי, עברי-אנגלי, טורקי-אנגלי וכן הלאה (תאורטית - לכל השפות). זה המצב בכל המיזמים, בין אם הוא מוצא חן בעינינו ובין אם לא. ויקימילון העברי מאוד חריג מהבחינה הזו בכך שהוא מגדיר את עצמו כיום כמילון עברי-עברי בלבד (אם כי יש בו כמה ערכים רב-לשוניים היסטוריים), אך נראה שזה עומד להשתנות בקרוב ואנחנו ניישר קו עם שאר המיזמים. אבל זה כבר נושא לדיון רחב בפני עצמו.
וזה מחזיר אותי לנושא ההומוגרפים. אני חושב שבהקשר הרב-לשוני קל יותר להבין איך התפתחה המוסכמה של "דף אחד לכל ההומוגרפים בכל השפות", כאשר הניווט מתבצע בעיקר באמצעות תוכן העניינים, וברור מכותרות השפות שאין קשר בין הערכים השונים למעט הכתיב המשותף. דוגמה קיצונית לכך היא הדף a בוויקימילון האנגלי, שבו דף פירושונים לא היה מקל על הסרבול (הבלתי נמנע במילון רב-לשוני) אלא רק מקשה על הגישה לערכים השונים. הטיעון הזה לא תקף אמנם לגבי ויקימילון העברי, כל עוד הוא חד-לשוני, אבל כאמור המצב הזה כנראה לא יימשך עוד זמן רב; ובכל אופן, אני מניח שיש לנו עניין לשמור על תאימות עם שאר המיזמים. ‏nevuer‏ • שיחה 22:43, 4 באוקטובר 2008 (IDT)[תגובה]
שכחתי לציין, אגב, שגם אני לחלוטין לא מקבל את האנלוגיה למילון אבן-שושן שהוצגה בדיון על ההומגרפים (וגם אמרתי זאת בעבר). בקיצור, הנימוק שלי להצגת ההומוגרפים בדף אחד הוא שזוהי מוסכמה שהתפתחה במיזמים אחרים משיקולים ראויים על רקע מסוים (הרקע הרב-לשוני, שאמנם עדיין זר לנו), ואנחנו צריכים ליישר קו עם המיזמים האלה. כמו כל מוסכמה צורנית יש בה שרירותיות מסוימת, ואני לא רואה בזה בעיה חמורה. אם היה מדובר בענייני תוכן המצב היה שונה. ‏nevuer‏ • שיחה 23:23, 4 באוקטובר 2008 (IDT)[תגובה]
אני מודע לכך שהמילון הוא רב-לשוני (למעשה, לא ידעתי שוויקימילון העברי מוגדר כיום כעברי-עברי בלבד, אבל זו הגדרה ראויה, בהתחשב בנסיבות). כנראה שאני באמת לא מבין כל כך את אופן השימוש בבינוויקי פה, אבל זה כבר עניין אחר. באיזה מילונים אחרים קיימות בעיות עם הומוגרפים, באותה חומרה? דומני שרק בערבית (ואולי בשפות אסיאתיות, שאינני מכיר) תיתכן בעיה כמו של חתול-חיתול. אגב, גם בעברית היא לא הייתה מתקיימת (או שהייתה קלה בהרבה) אילו המילון היה נכתב בכתיב מלא (באיזה עוד שפה יש התלבטות כזו?), או לחילופין אילו שמות הערכים היו מנוקדים - אבל זה כנראה בעייתי גם כן. ‏Odedee שיחה 21:26, 6 באוקטובר 2008 (IST)[תגובה]
שוב חזרנו לסוגיית הכתיב, כנראה שקשה להפריד בין הנושאים :) לדעתי שמות הערכים צריכים להיות בכתיב תקני כלשהו (כלומר מלא או מנוקד) מלכתחילה, בלי קשר לסוגיית ההומוגרפים. אם בדרך זה גם יקל על בעיית ההומוגרפים, אז טוב מאוד. אבל זה לא הנימוק העקרוני. הנימוק הוא שלא ייתכן שהערכים יאורגנו לפי שיטת כתיב שאינה קיימת (לפחות כיום). בעיית ההומוגרפים כשלעצמה (במנותק משאלת הכתיב) אינה מטרידה אותי כל כך, וגם אם היא הייתה מטרידה, לקום ולשנות את המדיניות בכל הוויקימילונים זה לא מעשי.
לגבי השיטה הרצויה, כתיב מלא או מנוקד, אני כאמור תומך בכיוון של כתיב מלא. בעבר נטיתי לניקוד שמות הערכים (ראה בסוף ארכיון הדיונים על כתיב מלא/חסר שקישרתי אליו קודם), אבל התגובות שכנעו אותי שזה לא רצוי. ‏nevuer‏ • שיחה 23:29, 6 באוקטובר 2008 (IST)[תגובה]
ברור שאי אפשר להפריד את הנושאים, כי הבחירה (חסרת התקדים?) שלא להשתמש ב"כתיב חסר הניקוד", ויחד עם זאת גם לא להשתמש בניקוד, היא הגורמת ליצירת רוב ההומוגרפים. על כל פנים, העובדה שאין כרגע פתרון מושלם אינה צריכה לגרום לנו לא לשים לב לכך שישנה בעיה. אבל אני חושש שבמצב הקהילה הנוכחי, יהיה קשה לקבל החלטה מושכלת, וכדאי יהיה לדון בעניין בפורום נרחב יותר, בימים יפים יותר. גמר חתימה טובה, ‏Odedee שיחה 15:51, 8 באוקטובר 2008 (IST)[תגובה]
במידה ונבחר ליצור ערכים מנוקדים, לא תהיה בעיה לבוט מתאים לסדר זאת. כעת אתייחס לצד השני של אי-הנוחיות שהצגת: אם למשל נתקלת במשפט עם מילה שאתה לא מכיר (חתול), וניגשת לויקימילון - מהו סדר הדברים? אם אתה מבין לפי ההקשר, אז אתה יודע לנווט בין ההומוגרפים; ואם אתה לא מבין את ההקשר, אתה תקרא את כולם עד שתמצא את מה שמשתלב הכי טוב. הבה נזכור שהחיה המצויה שמשתמשת במחשב צריכה מידה מסוימת של תובנה. אני לא רואה כל אפשרות להתגבר על כל הכשלים הקוגנטיביים של כל גולשי ויקימילון. Mintz l 17:14, 8 באוקטובר 2008 (IST)[תגובה]
זה עניין בסיסי של קלות השימוש במילון. אתה מניח שאני אשים בכלל לב שמדובר בהומוגרפים, ואבחר בהתאם. אבל כפי שכתבתי בפתיחת הדיון, די קל בכלל לא לשים לב שהמילון מציג משמעות ראשונה שהכתיב והמשמעות שלה שונים מהמבוקש - וזה בדיוק מה שקורה אם מחפשים "חיתול" אבל מקבלים "חתול". אם אני מקליד "חיתול" והמילון מחזיר לי דף שחציו הראשון עוסק בחתולים, יש פה בעיה של המילון, לא כשל קוגניטיבי של הקוראים. באיזו דרגת הצלחה הקוראים יתמודדו עם הבעיה של המילון - זו שאלה אחרת. המילון צריך לשאוף לא להציב בפני הקוראים דרישות סף גבוהות. מבין הקוראים שיחפשו את הערך "חיתול", יהיו חלק ששליטתם בעברית היא חלשה (לכן הם נעזרים במילון), וצריך לסייע להם, לא לערום בפניהם מכשולים ולהעביר אותם מבחנים קוגניטיביים.
אני גם חולק על דעתך ש"לא תהיה בעיה לבוט מתאים לסדר זאת" - שימוש בכתיב מלא או הוספת ניקוד (צעד בעייתי בהרבה), ובוודאי הפרדת הומוגרפים לפי כתיב או ניקוד, הם פעולות שדורשות שינוי מהותי בערכים, ומניסיוני עם מעשי בוטים - זה יותר ממה שכדאי לתת להם לעשות. אלה החלטות שכדאי לעשות בצורה הנכונה כשמתחילים ליצור את המילון, לא כשיש בו 100,000 ערכים. שינוי בשלב מאוחר הוא קשה הרבה יותר מאשר שינוי בשלב מוקדם. ‏Odedee שיחה 18:30, 8 באוקטובר 2008 (IST)[תגובה]
ואם חשבתי ש"חתול" ו"חיתול" הם בעיה קשה, כעת הועבר תת אדום לתת אדם. רבותי - זה כבר עצוב. ‏Odedee שיחה 19:31, 8 באוקטובר 2008 (IST)[תגובה]
מסכים לחלוטין בענין קבלת ההחלטות אבל ענין החיתול נפתר בקלות. בדף ההפניה של חיתול אפשר לסמן כותרת, כך שהקטע שיוצג יהיה על חיתול ולא חתול, הנה כך למשל: #הפניה חתול#חִתּוּל. כאשר יכתב ערך על תת-אדם אז נעשה אותו הדבר בתת-אדום. Mintz l 02:25, 9 באוקטובר 2008 (IST)[תגובה]
זה פותר חלק קטן מאוד מהבעיה. הבעיה העיקרית היא עצם העובדה שערכים שאין להם דבר במשותף - גם לא הכתיב - נמצאים באותו דף. ומרכיב מהותי בבעיה, לפחות בעיניי, הוא שיטת הכתיב החריגה שאימצנו לשמות הערכים בוויקימילון, שיטה שיש בה אמנם היגיון פנימי אבל אין בה common sense. זה פחות עניין של קלות הניווט, ויותר של עקרונות תכנון בסיסיים. אין לאמץ מוסכמות חריגות ללא הצדקה. ‏nevuer‏ • שיחה 19:55, 9 באוקטובר 2008 (IST)[תגובה]
אני מסכים בהחלט עם דברים אלה. ‏nevuer‏ • שיחה 19:37, 9 באוקטובר 2008 (IST)[תגובה]

פיצול הומוגרפים/הומונימים: רעיון חדש עריכה

קיימת אפשרות הטאבים (כמו בb:בגרות בספרות, אשר שואבת את הממשק שלה מתוך b:מדיה ויקי:Tabs.js. כך יהיה ניתן בדף כמו דבר להשתמש בטאבים במקום בתוכן עניינים, והקטגוריות ימוקמו בכל טאב בנפרד ע"י תבנית מתאימה (את זה האמת ניתן לעשות כבר עכשיו). מה דעתכם על פתרון מהסגנון הזה? Mintz l 23:18, 16 ביוני 2009 (IDT)[תגובה]

עולות במוחי תהיות רבות בנוגע לרעיון, הן מבחינת העיצוב והן מבחינות השימוש והנוחיות. אני חושב שרצוי ליצור תחילה הדגמה, על מנת לראות איך זה מסתדר בפועל. ‏LightBringer‏ • שיחה 23:28, 16 ביוני 2009 (IDT)[תגובה]
מהותית אני חושב שזה יכול להיות רעיון (או לפחות בסיס לרעיון) יפה, אבל כמה שיקולים פרקטיים מונעים ממני לתמוך בו. קודם כול, אני לא בטוח שזה רעיון טוב לבנות על JS בעניינים כאלה, הרי לא מדובר פה בשינוי קוסמטי. אולי לא כל הדפדפנים תומכים בזה? אולי זה לא יפריע אם גולשים מהסלולר?
השיקול השני הוא אחידות עם שאר הוויקימילונים, שבהם השיטה הזאת לא מקובלת. השפה עברית אמנם מציבה בפנינו כמה אתגרים ייחודיים (ע"ע כתיב מלא/חסר), אבל כשאפשר לעשות זאת עדיף לדעתי ליישר קו עם השפות האחרות. המיזם הזה הוא בכל זאת חלק מהמכלול הרב-לשוני. ‏nevuer‏ • שיחה 23:42, 16 ביוני 2009 (IDT)[תגובה]