כללי גרפ לצוד כל לועזית כולל גליפים מיוחדים של שפות אקזוטיות...

  • הוסף לסימניות
  • #1
שלום!
משהו יודע גרפ נח ויעיל יותר מאשר זה?
קוד:
([[=Q=]]|[[=W=]]|[[=E=]]|[[=R=]]|[[=T=]]|[[=Y=]]|[[=U=]]|[[=I=]]|[[=O=]]|[[=P=]]|[[=A=]]|[[=S=]]|[[=D=]]|[[=F=]]|[[=G=]]|[[=H=]]|[[=J=]]|[[=K=]]|[[=L=]]|[[=Z=]]|[[=X=]]|[[=C=]]|[[=V=]]|[[=B=]]|[[=N=]]|    [[=M=]]|[[=q=]]|[[=w=]]|[[=e=]]|[[=r=]]|[[=t=]]|[[=y=]]|[[=u=]]|[[=i=]]|[[=o=]]|[[=p=]]|[[=l=]]|[[=k=]]|[[=l=]]|[[=Z=]]|[[=X=]]|[[=C=]]|[[=V=]]|[[=B=]]|[[=N=]]|[[=M=]])+
 
  • הוסף לסימניות
  • #2
תשתמש ביוניקוד.
הגם שאני לא מכיר את מה שהעלאת לכאן.
 
  • הוסף לסימניות
  • #3
נכתב ע"י ונתנו10;1493664:
תשתמש ביוניקוד.
הגם שאני לא מכיר את מה שהעלאת לכאן.

מהיכן אדע כל היוניקוד של השפות הנ"ל? :(

מה שעשיתי הוא פשוט וברברי...
כתוב בעזרה של אינדזיין ככה:
[[==a==]] מוצא כל הסט של הa כולל a עם נקודות על הראש ומכל הכיונים...

אז עשיתי סט כזה של כל הABC ושמתי בתוך ()+ עם | מפרידים.

בתחילה ניסיתי [[[==a==]]-[[==z==]] [[[==A==]]-[[==Z==]]]
אבל לא עבד משום מה
 
  • הוסף לסימניות
  • #4
השאלה מה עוד מוצא מה שכתבת. ולמתי זה יבוא לידי שימוש.
ואפשר להבין למה המקף הרס, כי זה הפך אותו לסדרה, כמו א-ו שזה מא' עד ו'.
היית יכול לוותר עליהם וזה היה עובד מצויין.
 
  • הוסף לסימניות
  • #5
אולי אני לא מבין מה אתה רוצה לעשות... אבל,
במקום לחפש כל תו לועזי, למה לא לחפש הכל חוץ מתווי עברית?
 
  • הוסף לסימניות
  • #6
אין לי מושג באיזה שפות אתה מתעסק, אך לגבי שאלתך, לכאורה זה יספיק לך:
קוד:
[a-ԝ]+
(זה לא W אלא אות אחרת)
 
  • הוסף לסימניות
  • #7
נכתב ע"י ונתנו10;1493745:
אין לי מושג באיזה שפות אתה מתעסק, אך לגבי שאלתך, לכאורה זה יספיק לך:
קוד:
[a-ԝ]+
(זה לא W אלא אות אחרת)
נ"ב- A היא קודמת לa
כך שזו מחרוזת לא נכונה

נ"ב שני: בטעות מחקתי התוכן שכתבתי כאן מקודם במקום להוסיף, כך שתגובתך בהמשך נראית בגלל זה לא מובנת, מחילה.
 
  • הוסף לסימניות
  • #8
פתחתי את חלון הגליפים ובחרתי באחרון מהשפות הלטיניות (זה לא כולל ערבית לדוגמה).
 
  • הוסף לסימניות
  • #9
בנתיים פתחתי את הטבלה הזאת:
http://unicode-table.com/en/#0370
והגעתי למסקנה שהחיפוש הזה טוב לכל השפות הלטיניות (ללא הקריליות).
[A-ʸ]
ולשם תפיסת רווח וגרשיים וכו בתוך האנגלית וצמוד אליה אני משתמש בזה:
[\"']*[A-ʸ]+([^א-ת]+[A-ʸ]+)*[\"']*
מה דעתך?
מכיר משהו טוב יותר?
(עיקר השאלה היא לגבי רווחים וגרשים שזה נוגע לכל חיפוש אנגלית גם הרגיל של[A-z])
 
  • הוסף לסימניות
  • #10
כעת מצאתי ההבדל בין החיפוש של אינדזיין "כל תו(any later)" לחיפוש הזה:[A-Za-z]
בזה שהוא מוצא גם תווים מוזרים!
וצריך:
[\"']*[\l\u]+([^א-ת]+[\l\u]+)*[\"']*

ומה שהצעתי קודם, מצאתי חיסרון, שהסט הזה כנראה כולל גם סוגריים מרובעים (חלק מהם לפחות...) וגם רווחים קשיחים!

וזה לא בגלל התוספת של התוים המיוחדים שהוספתי אלא גם המחרוזת הזו לבד מוצאת ככה:[A-z]+
כנראה אין רצף בין האABC הגדול והקטן, ובאמצע מסתתרים כמה סמנים פיסוק שונים,(לא כולם..) (אפשר למצוא מה הם על ידי חיפוש כזה[Z-a])
ואם לא רוצים ה[\l\u] אז לאנגלית רגילה צריך [A-Za-z] ואי אפשר לקצר ל[A-z]



טקסט מוזר לדוגמה:
Sužiedėlis, “The Historical Sourc
 
  • הוסף לסימניות
  • #11
נכתב ע"י eliezer;1495245:
ואי אפשר לקצר ל[A-z]
מה שכתבת לא אפשרי, כי תו A גדולה נמצא ברשימה אחרי z קטנה.
ולכן אם תרצה לחפש כל תו אנגלי תוכל לעשות את זה ע"י [a-Z] אבל קח בחשבון שישנם כמה תווים נוספים שימצא (כי תו A גדולה לא נמצאת ישר אחרי z לפי סדר יוניקוד)
 
  • הוסף לסימניות
  • #12
נכתב ע"י eliezer;1495208:
מה דעתך?
מכיר משהו טוב יותר?
לא יודע אם טוב יותר, אבל נראה לי שאפשר לקצר את אורך השורה קצת.
 
  • הוסף לסימניות
  • #13
נכתב ע"י ונתנו10;1495329:
מה שכתבת לא אפשרי, כי תו A גדולה נמצא ברשימה אחרי z קטנה.
ולכן אם תרצה לחפש כל תו אנגלי תוכל לעשות את זה ע"י [a-Z] אבל קח בחשבון שישנם כמה תווים נוספים שימצא (כי תו A גדולה לא נמצאת ישר אחרי z לפי סדר יוניקוד)

הפוך במחילה
החיפוש הזה [A-z] ימצא כל הלועזית וגם קצת באמצע עוד כמה תווים שונים
ואילו החיפוש הזה:
[a-Z] לא ימצא כלום כי a בא אחרי Z
 

קבצים מצורפים

  • א.PNG
    KB 38.3 · צפיות: 16
  • ב.PNG
    KB 30.1 · צפיות: 21
  • הוסף לסימניות
  • #15
לרוב אין צורך בגרעפ כזה, כי למרבה המזל כשמקלידים בוורד באותיות לטיניות, השפה משתנה בהתאם בצורה אוטומטית. ולכן אפשר באינדיזיין פשוט לחפש את שפת האנגלית למיניו.
 
  • הוסף לסימניות
  • #16
בכל אופן, לשאלתך, הדרך הפשוטה היא זו:

קוד:
[\u\l]

:)
 
  • הוסף לסימניות
  • #17
כמובן. זה אשכול לחידודי בעלמא :)
 
  • הוסף לסימניות
  • #18
נכתב ע"י אריאל וו;1496415:
בכל אופן, לשאלתך, הדרך הפשוטה היא זו:

קוד:
[\u\l]

:)
זה מה שכתבתי בעצם במסקנה רק הוספתי תוספות לחיפוש תווים נספחים. לעיצוב אחיד.


למה לחידודי בעלמא?! זה מקרה מעשי מאד שנתקלתי במילים בפולנית או משהו כזה בספר
 

פרוגבוט

תוכן שיווקי
פרסומת

הצטרפות לניוזלטר

איזה כיף שהצטרפתם לניוזלטר שלנו!

מעכשיו, תהיו הראשונים לקבל את כל העדכונים, החדשות, ההפתעות בלעדיות, והתכנים הכי חמים שלנו בפרוג!

לוח מודעות

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק כה

אלְדָוִד אֵלֶיךָ יי נַפְשִׁי אֶשָּׂא:באֱלֹהַי בְּךָ בָטַחְתִּי אַל אֵבוֹשָׁה אַל יַעַלְצוּ אֹיְבַי לִי:גגַּם כָּל קוֶֹיךָ לֹא יֵבֹשׁוּ יֵבֹשׁוּ הַבּוֹגְדִים רֵיקָם:דדְּרָכֶיךָ יי הוֹדִיעֵנִי אֹרְחוֹתֶיךָ לַמְּדֵנִי:ההַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם:וזְכֹר רַחֲמֶיךָ יי וַחֲסָדֶיךָ כִּי מֵעוֹלָם הֵמָּה:זחַטֹּאות נְעוּרַי וּפְשָׁעַי אַל תִּזְכֹּר כְּחַסְדְּךָ זְכָר לִי אַתָּה לְמַעַן טוּבְךָ יי:חטוֹב וְיָשָׁר יי עַל כֵּן יוֹרֶה חַטָּאִים בַּדָּרֶךְ:טיַדְרֵךְ עֲנָוִים בַּמִּשְׁפָּט וִילַמֵּד עֲנָוִים דַּרְכּוֹ:יכָּל אָרְחוֹת יי חֶסֶד וֶאֱמֶת לְנֹצְרֵי בְרִיתוֹ וְעֵדֹתָיו:יאלְמַעַן שִׁמְךָ יי וְסָלַחְתָּ לַעֲוֹנִי כִּי רַב הוּא:יבמִי זֶה הָאִישׁ יְרֵא יי יוֹרֶנּוּ בְּדֶרֶךְ יִבְחָר:יגנַפְשׁוֹ בְּטוֹב תָּלִין וְזַרְעוֹ יִירַשׁ אָרֶץ:ידסוֹד יי לִירֵאָיו וּבְרִיתוֹ לְהוֹדִיעָם:טועֵינַי תָּמִיד אֶל יי כִּי הוּא יוֹצִיא מֵרֶשֶׁת רַגְלָי:טזפְּנֵה אֵלַי וְחָנֵּנִי כִּי יָחִיד וְעָנִי אָנִי:יזצָרוֹת לְבָבִי הִרְחִיבוּ מִמְּצוּקוֹתַי הוֹצִיאֵנִי:יחרְאֵה עָנְיִי וַעֲמָלִי וְשָׂא לְכָל חַטֹּאותָי:יטרְאֵה אוֹיְבַי כִּי רָבּוּ וְשִׂנְאַת חָמָס שְׂנֵאוּנִי:כשָׁמְרָה נַפְשִׁי וְהַצִּילֵנִי אַל אֵבוֹשׁ כִּי חָסִיתִי בָךְ:כאתֹּם וָיֹשֶׁר יִצְּרוּנִי כִּי קִוִּיתִיךָ:כבפְּדֵה אֱלֹהִים אֶת יִשְׂרָאֵל מִכֹּל צָרוֹתָיו:
נקרא  2  פעמים
למעלה