כללי תו מסתורי והרסני שהורס עימוד באינדיזיין

  • הוסף לסימניות
  • #1
מישהו נתקל פעם בתופעה משונה זו או יודע להסביר אותה?

תוכנת פיינרידר המבצעת OCR לקבצים, מכניסה תווים שונים, כנראה כדי לשמור על העיצוב המקורי.

אחד התווים הוא תו נסתר, שהכנסתי אותו כאן, והוא כאמור בלתי נראה:
This user does not have permission to use the HTML BB code.
באינדיזיין הוא מוצג כך:
attachment.php

התו המוזר הזה הרסני - כל פיסקה בה הוא מופיע, נמחקת על ידי אינדיזיין! כך, בעימוד ספר שבו הועתקו ציטטות מתוך קבצי פידיאף שהומרו על ידי פיינרידר, נעלמו, ולולא עינו החדה של המעמד היה הספר יורד לדפוס בלעדיהן.

התו הזה גם זדוני באופן מסתורי: ביצוע "החלף הכל" שלו עם "ריק" בוורד, לא מוחק אותו. צריך לעבור אחד אחד ולמחוק.

מישהו מכיר את התו ויודע למה הוא אמור לשמש? מישהו יודע איך למנוע מראש בעיות כאלו?
 

קבצים מצורפים

  • image001.png
    KB 18.9 · צפיות: 20
  • הוסף לסימניות
  • #2
אגדיר את הבעיה בדיוק יותר (אני המעמד):
בעת הייבוא אינדיזיין מוחקת את הטקסט שאחרי התו עד סוף הפיסקה.
חשוב לציין שזה לא תמיד.

הלוכסן הזה הופיע לי גם בספר אחר, ושם הוא הפך את כיוון התוים עברית-תירבע.
 
  • הוסף לסימניות
  • #3
כמדומני שזה תו RTL (היפוך כיוון טקסט) שאינדיזיין לא מסתדר איתו.
יש מצב להעלות קובץ וורד לדוגמה?
 
  • הוסף לסימניות
  • #4
בבדיקה חוזרת:
זה אחד מה־Unicode Markers (אפשר למצוא אותם בקליק ימיני, Insert Special ME Character).


> Left To Right Mark (LRM) <200E> \x{200E} U+200E (LEFT-TO-RIGHT MARK) leftToRightMark [6] 536C726D
< Right To Left Mark (RLM) <200F> \x{200F} U+200F (RIGHT-TO-LEFT MARK) rightToLeftMark [6] 53726C6D

Left To Right Embedding (LRE) <202A> \x{202A} U+202A (LEFT-TO-RIGHT EMBEDDING) leftToRightEmbedding [7] 536C7265

Right To Left Embedding (RLE) <202B> \x{202B} U+202B (RIGHT-TO-LEFT EMBEDDING) rightToLeftEmbedding [7] 53726C65

Left To Right Override (LRO) <202D> \x{202D} U+202D (LEFT-TO-RIGHT OVERRIDE) leftToRightOverride [7] 536C726F

Right To Left Override (RLO) <202E> \x{202E} U+202E (RIGHT-TO-LEFT OVERRIDE) rightToLeftOverride [7] 53726C6F
/
Pop Directional Formatting (PDF) <202C> \x{202C} U+202C (POP DIRECTIONAL FORMATTING) popDirectionalFormatting [7] 53706466



http://www.indiscripts.com/blog/pub...haracters/en_InDesignCS4-CS5-SpecialChars.pdf
http://unicode-table.com/en/search/?q=left+to+right+marker
 

קבצים מצורפים

  • en_InDesignCS4-CS5-SpecialChars-3.jpg
    KB 650.7 · צפיות: 21
  • הוסף לסימניות
  • #5
תודה רבה נתי. יש לך רעיון איך למנוע את הבעיה בייבוא?
 
  • הוסף לסימניות
  • #6
ניסית להביא את הטקסט נקי מעיצוב?
אם זה לא עוזר, תנקה את הכל בוורד ואז תעביר מחדש.
 
  • הוסף לסימניות
  • #7
שלח או תעלה קובץ דוגמה.
ואם זה עוד קריטי אםשר לבקש מהארבס שיקפוץ לכאן.
 
  • הוסף לסימניות
  • #8
קשה להוסיף משהו בלי לראות קובץ.
סביר להניח שזה באג ביבוא, אבל ייתכן שיש דרך למחוק הסימנים באופן אוטומטי.
 
  • הוסף לסימניות
  • #9
גם העתקת טקסט בלבד משאירה את הסימן הזה.
כפי שכתבתי קודם, גם ביצוע "החלף הכל" שלו עם "ריק" בוורד, לא מוחק אותו. צריך לעבור אחד אחד ולמחוק.
מצורף קובץ לדוגמה. בכל מקום שמופיע התו הזה, הכנסתי לידו שטרודל.
 

קבצים מצורפים

  • דוגמה.doc
    KB 26.5 · צפיות: 32
  • הוסף לסימניות
  • #10
תו מעניין (שכחת להוסיף סימון אחרי "הנכר")
אבל האינדיזיין קרא אותו בקלות וגם הסכים למחוק אותו בבת אחת מכל המסמך
 
  • הוסף לסימניות
  • #11
אני גם לא רואה בעיה באינדיזיין.
 
  • הוסף לסימניות
  • #12
מצטרף לקודמי
 
  • הוסף לסימניות
  • #13
בכל אופן הנה סקריפט לאינדיזיין שמוחק כל התווים האלו מקובץ .txt
 

קבצים מצורפים

  • RemoveDirectionCharacters.zip
    391 ביטים · צפיות: 21
  • הוסף לסימניות
  • #14
עד ש"חיטובים" יגיע, אסביר את הבעיה כפי שהבנתי ממנו - כשהתו הזה מופיע בהערת שוליים בוורד, אינדיזיין לא מייבא את המשך ההערה שאחרי התו הזה.

יש לכם גם עצה איך למחוק את התו הזה מוורד בפעולה אחת? הדבר יועיל גם לעורכים וסופרים (כמוני), ולא יצטרכו להגיע לפתרון בשלב של המעמדים.
 
  • הוסף לסימניות
  • #15
אם תעלה קובץ כזה שלא מייבא לאינדיזיין, אני אעביר אותו לAdobe...
 
  • הוסף לסימניות
  • #16
נכתב ע"י nothing;1073711:
יש לכם גם עצה איך למחוק את התו הזה מוורד בפעולה אחת? הדבר יועיל גם לעורכים וסופרים (כמוני), ולא יצטרכו להגיע לפתרון בשלב של המעמדים.
אפשר להשתמש באותו רעיון בסקיפט vb לעשות הפעולה בוורד. או להוציא הטקסט הוורד ולהפעיל הסקריפט מאינדיזיין...
 
  • הוסף לסימניות
  • #17
גבריאל, שלחתי לך את הקובץ המקורי במייל.
 
  • הוסף לסימניות
  • #18
מאקרו למחוק סימנים אלו בוורד
קוד:
Sub Hidden_rtl_mark()
Selection.Find.Execute findText:=ChrW(8236), MatchWildcards:=True, Forward:=True, Wrap:=wdFindContinue, Format:=False, ReplaceWith:="", Replace:=wdReplaceAll
End Sub
 
  • הוסף לסימניות
  • #19
קרש, גם אני חשבתי על מאקרו כזה, אך הוא לא עובד, כיון שכאמור - פעולת "החלף הכל" בריק אינה מוחקת את התו המעצבן הזה. (בדקתי גם עם המאקרו שנתת, ליתר בטחון, ואכן לא עבד).

יש פקודת מאקרו שמוחקת תווים מסויימים, במקום הפקודה שמחליפה אותם בריק?
 
  • הוסף לסימניות
  • #20
המאקרו מוחק רק תו יוניקוד 8236, ואצלי הוא עובד.
אולי יש עוד תוים?
 

פרוגבוט

תוכן שיווקי
פרסומת

הצטרפות לניוזלטר

איזה כיף שהצטרפתם לניוזלטר שלנו!

מעכשיו, תהיו הראשונים לקבל את כל העדכונים, החדשות, ההפתעות בלעדיות, והתכנים הכי חמים שלנו בפרוג!

לוח מודעות

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק כה

אלְדָוִד אֵלֶיךָ יי נַפְשִׁי אֶשָּׂא:באֱלֹהַי בְּךָ בָטַחְתִּי אַל אֵבוֹשָׁה אַל יַעַלְצוּ אֹיְבַי לִי:גגַּם כָּל קוֶֹיךָ לֹא יֵבֹשׁוּ יֵבֹשׁוּ הַבּוֹגְדִים רֵיקָם:דדְּרָכֶיךָ יי הוֹדִיעֵנִי אֹרְחוֹתֶיךָ לַמְּדֵנִי:ההַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם:וזְכֹר רַחֲמֶיךָ יי וַחֲסָדֶיךָ כִּי מֵעוֹלָם הֵמָּה:זחַטֹּאות נְעוּרַי וּפְשָׁעַי אַל תִּזְכֹּר כְּחַסְדְּךָ זְכָר לִי אַתָּה לְמַעַן טוּבְךָ יי:חטוֹב וְיָשָׁר יי עַל כֵּן יוֹרֶה חַטָּאִים בַּדָּרֶךְ:טיַדְרֵךְ עֲנָוִים בַּמִּשְׁפָּט וִילַמֵּד עֲנָוִים דַּרְכּוֹ:יכָּל אָרְחוֹת יי חֶסֶד וֶאֱמֶת לְנֹצְרֵי בְרִיתוֹ וְעֵדֹתָיו:יאלְמַעַן שִׁמְךָ יי וְסָלַחְתָּ לַעֲוֹנִי כִּי רַב הוּא:יבמִי זֶה הָאִישׁ יְרֵא יי יוֹרֶנּוּ בְּדֶרֶךְ יִבְחָר:יגנַפְשׁוֹ בְּטוֹב תָּלִין וְזַרְעוֹ יִירַשׁ אָרֶץ:ידסוֹד יי לִירֵאָיו וּבְרִיתוֹ לְהוֹדִיעָם:טועֵינַי תָּמִיד אֶל יי כִּי הוּא יוֹצִיא מֵרֶשֶׁת רַגְלָי:טזפְּנֵה אֵלַי וְחָנֵּנִי כִּי יָחִיד וְעָנִי אָנִי:יזצָרוֹת לְבָבִי הִרְחִיבוּ מִמְּצוּקוֹתַי הוֹצִיאֵנִי:יחרְאֵה עָנְיִי וַעֲמָלִי וְשָׂא לְכָל חַטֹּאותָי:יטרְאֵה אוֹיְבַי כִּי רָבּוּ וְשִׂנְאַת חָמָס שְׂנֵאוּנִי:כשָׁמְרָה נַפְשִׁי וְהַצִּילֵנִי אַל אֵבוֹשׁ כִּי חָסִיתִי בָךְ:כאתֹּם וָיֹשֶׁר יִצְּרוּנִי כִּי קִוִּיתִיךָ:כבפְּדֵה אֱלֹהִים אֶת יִשְׂרָאֵל מִכֹּל צָרוֹתָיו:
נקרא  2  פעמים
למעלה