ויקיפדיה:סקר קוראים/אוקטובר 2009/ניתוח סטטיסטי

מתוך ויקיפדיה, האנציקלופדיה החופשית

בדף זה מוצג ניתוח סטטיסטי עתיר-גרפים של סקר הקוראים שנערך באוקטובר 2009. הניתוח כולו תיאורי, ואינו כולל בדיקת השערות או נסיונות לאמידת פרמטרים.

התפלגות מספר התשובות למשיב (מתוך 23 שאלות הסקר)

הסקר נמשך שבוע, והשתתפו בו 3394 משיבים. כ-90% מהם ענו כמעט על כל השאלות. יש רק כמה עשרות של רשומות ריקות או כמעט ריקות. התוצאות עקביות ונראה שהמשיבים התייחסו לסקר ברצינות. כל האחוזים בהמשך הם מתוך המשיבים על אותה שאלה.

הערות רבות מניתוח הסקר הקודם (ויקיפדיה:סקר קוראים/יולי 2007/ניתוח סטטיסטי) נכונות גם הפעם, ולא חזרתי עליהן.

עקב תקלה טכנית, התשובות לשאלה האחרונה (על מידת ההיכרות עם וויקיפדיה) אבדו, ולכן התוצאות מתייחסות לכלל המשיבים; אין אפשרות לבודד את המשיבים שאינם משתמשים רשומים, כפי שרצוי היה לעשות.

התשובות לשאלות הסקר[עריכת קוד מקור]

שביעות רצון מהתוכן[עריכת קוד מקור]

1. באיזו מידה לדעתכם ויקיפדיה העברית אמינה?

כ-75% מייחסים לוויקיפדיה אמינות גבוהה או גבוהה מאד, ורק 5% אמינות נמוכה או נמוכה מאד. 41 משיבים (1.2%) חושבים, משום מה, שזה לא רלוונטי. גיל המשיב כמעט אינו משפיע על התשובות לשאלה זו.

2. מה דעתכם על רמת העברית בוויקיפדיה העברית באופן כללי?

לכ-40% מהמשיבים הרמה גבוהה מדי (7%) או גבוהה. ל-54% היא בסדר גמור, ולעוד 5% נמוכה מדי.

3. בעת חיפוש בוויקיפדיה, האם נמצא מענה למבוקשכם?

72% מוצאים מענה כמעט תמיד או בדרך כלל; עוד 22% לפעמים, ורק 4.8% בדרך כלל לא או גרוע מזה.

4. האם קרה שהתקשיתם במציאת ערך על מושג בעברית, בשל ספק לגבי איות המלה?

12% אומרים שכן.

5. האם קרה שהתקשיתם במציאת ערך על אדם או מקום שמקור שמו לועזי, בשל ספק לגבי איות המלה?

19% אומרים שכן.

6. באיזו מידה לדעתכם יכולה ויקיפדיה העברית להחליף את האנציקלופדיות המודפסות?

69% חושבים שבמידה רבה או אף רבה מאד, 20% במידה בינונית, ו-11% במידה מועטה או מועטה מאד. גם כאן הגיל כמעט אינו משפיע על התשובות.

7. אם יוחלט להדפיס חלק מערכי ויקיפדיה הנבחרים, ולשווק את הספר במחירי עלות, האם תשקלו לרכוש ספר זה לשימוש עצמי או כמתנה?

בערך 35% כן או אולי כן, בערך 65% כנראה שלא.

8. האם ישנם נושאים שלדעתכם אינם מכוסים ברמה טובה בוויקיפדיה העברית?

לפי 37% מהמשיבים, רק נושאים בודדים חסרים.

שביעות רצון מכלי הניווט[עריכת קוד מקור]

9. באיזו מידה משמשים אתכם הפורטלים הקיימים בוויקיפדיה העברית?

בפורטלים משתמשים במידה רבה או בינונית רוב המשיבים.

10. באיזו מידה משמשות אתכם הקטגוריות הקיימות בוויקיפדיה העברית?

ובקטגוריות - שני שלישים.

השוואה בין מידת השימוש בפורטלים (1-במידה רבה מאד, עד 6-"מה זה פורטלים?") למידת השימוש בקטגוריות (1-במידה רבה מאד, עד 6-"מהן קטגוריות?").

השוואה בין הקושי באיתור ערכים (התשובה לשאלה "האם מצאת מענה למבוקשך" בסולם 1-6, פחות סכום התשובות לשאלות על קושי באיות, בסולם 1-3; ככל שהמספר גבוה יותר, מוצאים פחות ונתקלים ביותר קושי), לבין השימוש בפורטלים וקטגוריות (סכום התשובות לגבי מידת השימוש, בסולם 1-6; ככל שהמספר גבוה יותר, השימוש מועט יותר). הנקודות ברבע השמאלי-תחתון מייצגות את אלו שמוצאים את מבוקשם ומשתמשים בקטגוריות. הנקודות ברבע השמאלי-עליון מייצגות את אלו שמוצאים את מבוקשם ואינם משתמשים בקטגוריות, וכן הלאה.

11. האם ידוע לכם כיצד ניתן לעבור מערך בשפה העברית לאותו ערך בשפה זרה?

שלושה רבעים יודעים איך לעבור, ורבע - לא.

12. האם ידוע לכם מה מסמלים צבעי הקישורים (קישור כחול לעומת קישור אדום)?

כ-28% מהקוראים אינם יודעים מה פשר הצבעים המוזרים האלה.

13. באיזו מידה משמש אתכם העמוד הראשי כשער כניסה לאתר?

כ-60% נכנסים לאתר במידה בינונית או רבה דרך העמוד הראשי.

נכונות להפוך לכותב/ת[עריכת קוד מקור]

14. האם, למיטב ידיעתכם, יש לכם כקוראים אפשרות לתקן ערכים בוויקיפדיה העברית?

30% חושבים שלא.

15. האם ידוע לכם כיצד ניתן להעביר משוב על ערכים?

60% לא יודעים. אולי לא קישרו "שיחה" עם משוב.

בגרף השני מוצגת התפלגות מספר התשובות הנכונות לשאלות ההיכרות עם ויקיפדיה (שאלות 11, 12, 14, 15), על-פי גיל המשיב. כאן יש הבדלים ניכרים.

16. האם נתקלתם אי פעם בטעות עובדתית בוויקיפדיה העברית?

36% נתקלו בטעויות עובדתיות. זה לא מפריע ל-60% מהם לייחס לוויקיפדיה אמינות "גבוהה" או "גבוהה מאד".

17. האם אי פעם תיקנתם טעות עובדתית בוויקיפדיה?

רק 29% השיבו על השאלה הזו. 14% תיקנו, 15% לא תיקנו, 2% העירו בדף השיחה.

18. האם ברצונכם לכתוב בוויקיפדיה העברית? אם לא, מדוע?

37% רוצים לכתוב, 63% לא רוצים. בין אלו שלא רוצים, הרוב מציינים העדר ידע מקצועי או מחסור בזמן.

נתונים דמוגרפיים[עריכת קוד מקור]

19. גיל.

כ-58% מהמשיבים מתחת גיל 21. כ-8% מעל גיל 40.

20. השכלה.

25% תלמידי תיכון, 30% בעלי השכלה אקדמית.

21. מגדר.

68% גברים, השאר נשים. בין הנשים, 25% רוצות לכתוב בוויקיפדיה; בין הגברים - 44%.

22. שפת אם

כ-89% כותבים ששפת אמם עברית. הגרף מציג את התפלגות שאר ה-11%.

ניתוח צירים[עריכת קוד מקור]

אם מוותרים על שתי שאלות ההמשך ("אם מצאת טעות - האם תיקנת", "אם אינך רוצה להפוך לכותב, מדוע"), נשארים בדיוק 2400 משיבים שענו על כל השאלות, והמשך הניתוח נוגע להם בלבד. את המשיבים האלה אפשר לייצג באמצעות 2400 נקודות במרחב בן 21-ממדים, המתאימים לשאלות השונות. ניתוח צירים הוא שיטה סטטיסטית המאפשרת למצוא את הכיוונים שבהם ענן הנקודות הזה מסודר, ולהטיל אותו על (נאמר) שני צירים ראשיים הנושאים את מירב האינפורמציה. כך, על-ידי סיבוב המרחב באופן הנכון, אפשר לצפות בתופעות שטבעו הרב-ממדי של המדגם מקשה לראות באופנים אחרים.

באופן עקרוני, מכיוון שיש 21 שאלות שונות, יש להציג 21 מספרים נפרדים לכל משיב. ניתוח הצירים מאפשר לקבל יותר אינפורמציה עבור צירים מסויימים, שהשיטה בוחרת בקפידה, מאשר החלק האחד מ- 21 שמגיע לכל שאלה באופן נאיבי.

במקרה שלנו מחזיק הציר הראשון 15.6% מן האינפורמציה (משקל השווה לזה של 3.3 שאלות), ואילו הציר השני מחזיק בעוד 10% (כשתי שאלות). הטלת 2400 הנקודות על המישור המתאים לשני צירים אלה נותנת (במקרה שלנו) רסס מעוגל ואחיד של נקודות, המדגים עבור כל משיב עד כמה הוא קרוב לממוצע.

השתמשתי בהטלה הזו כדי לענות על השאלה המסקרנת הבאה: האם אפשר לנבא את מינו של המשיב מן התשובות שלו (או שלה) לשאלות הסקר, למעט כמובן שאלת המגדר? הגרף מציג את ההיטלים עבור הגברים (נקודות כחולות) והנשים (נקודות אדומות), לאחר נטרול מרכיב המגדר משני הצירים הראשיים. מתברר שהתשובה חיובית: בין 240 המשיבים הצפוניים ביותר בגרף יש 55% נשים, ובין 240 המשיבים הדרומיים ביותר רק 14% נשים (וזאת לעומת 30% בכלל האוכלוסיה).

באופן אנלוגי לכך, אפשר להטיל גם את 21 השאלות על שני הצירים, ולקבל מעין פירוק של כל שאלה למרכיבים העיקריים שלה; ולהיפך, לקבל תאור של כל ציר בתור צירוף של שאלות. היטל זה נתון באיור שבראש הסעיף, ואפשר לראות בו איך השאלות הקרובות מתקבצות בקבוצות: ההשכלה קרובה לגיל, כל שאלות הידע (יחד עם הרצון לכתוב - והמגדר!) מופיעות יחד, ההתייחסות לקטגוריות ולפורטלים אחידה, וכו'.

בציר הראשון בולטות השאלות על אמינות (0.36), מתן המענה (0.30) והתחומים החסרים (בסימן ההפוך: 0.32-). אולי זה ציר של "שביעות רצון". בציר השני בולטות שאלות הידע והרצון לכתוב, לעומת ההשכלה והגיל. זה עשוי להיות ציר השייכות והתחושה הנינוחה מול האתר. כעת אפשר לנתח כל שאלה, על-פי המרכיבים שיש לה בשני הצירים. למשל, שאלת שפת האם אינה באה כמעט לידי ביטוי באף אחד מן הצירים (מן הסתם מחכה לתורה, לבלוט בציר השלישי).