כללי יבוא PDF לאינדזיין

  • הוסף לסימניות
  • #21
אני שואל האם יש אפשרות לתקן את עמוד הגמרא שנסרק לקובץ PDF,
שיהיה כמו PDF מקורי של הייצוא שנשלח להיברובוקס

אני מצרף פה עמוד מהיברובוקס שנראה לי שהוא גם סרוק
והוא כן נשמר כטקסט לאחר שאני סוגר ל PDF
 

קבצים מצורפים

  • דעת תבונות.pdf
    KB 47.8 · צפיות: 73
  • הוסף לסימניות
  • #22
יש פונט שקוף של ה OCR.
כשאתה סוגר מאינדיזיין, אתה חייב להחליף ב Find Font את הפונט של ה OCR בפונט שקיים אצלך במחשב (לא משנה איזה)
אח"כ זה אמור לעבוד לך.
אבל זה לא יעזור לך לצורך הקטנה של נפח הקובץ
 
  • הוסף לסימניות
  • #23
נכתב ע"י יוחנן ק;1689512:
אני שואל האם יש אפשרות לתקן את עמוד הגמרא שנסרק לקובץ PDF,
שיהיה כמו PDF מקורי של הייצוא שנשלח להיברובוקס

אני מצרף פה עמוד מהיברובוקס שנראה לי שהוא גם סרוק
והוא כן נשמר כטקסט לאחר שאני סוגר ל PDF

אף אחד לא שולח להיברובוקס היצוא המקורי שלהם, היברו בוקס סורק בעצמם וממירים את זה לטקסט דרך OCR כלומר נוצר שכבה שלא רואים של טקסט

מה שאתה רוצה זה לקחת קובץ סרוק ולהוציא טקסט מזה תתקן אותי אם אני טועה
כדי לעשות את זה אתה צריך תוכנה המרה לOCR יש מובנה באקרובט אבל זה לא מי יודע מה ויש תוכנות בנויים לזה לדוג' ABBYY FineReader שזה אחד מהטובים בשוק
 
  • הוסף לסימניות
  • #24
נכתב ע"י asf;1689590:
אף אחד לא שולח להיברובוקס היצוא המקורי שלהם, היברו בוקס סורק בעצמם וממירים את זה לטקסט דרך OCR כלומר נוצר שכבה שלא רואים של טקסט

לא מדוייק
יש מחברים והוצאות ששולחים להיברובוקס קבצי PDF מקוריים
 
  • הוסף לסימניות
  • #25
נכתב ע"י asf;1689590:
מה שאתה רוצה זה לקחת קובץ סרוק ולהוציא טקסט מזה תתקן אותי אם אני טועה
כדי לעשות את זה אתה צריך תוכנה המרה לOCR יש מובנה באקרובט אבל זה לא מי יודע מה ויש תוכנות בנויים לזה לדוג' ABBYY FineReader שזה אחד מהטובים בשוק

כלומר, הבעיה שנוצרה אצלי אחרי ההמרה באקרובט (של גופנים בלתי זמינים), לא אמורה להיווצר בABBYY FineReader , או שבטקסט כזה אין אפשרות לקבל מצג טקסט, מחמת אי יכולת זיהוי פונטים ישנים
 
  • הוסף לסימניות
  • #26
נכתב ע"י אברהם;1689563:
יש פונט שקוף של ה OCR.
כשאתה סוגר מאינדיזיין, אתה חייב להחליף ב Find Font את הפונט של ה OCR בפונט שקיים אצלך במחשב (לא משנה איזה)
אח"כ זה אמור לעבוד לך.
אבל זה לא יעזור לך לצורך הקטנה של נפח הקובץ

אין אפשרות להחליף
 

קבצים מצורפים

  • החלפת גופן.png
    KB 314.5 · צפיות: 40
  • הוסף לסימניות
  • #27
נכתב ע"י יוחנן ק;1689512:
אני שואל האם יש אפשרות לתקן את עמוד הגמרא שנסרק לקובץ PDF,
שיהיה כמו PDF מקורי של הייצוא שנשלח להיברובוקס

אני מצרף פה עמוד מהיברובוקס שנראה לי שהוא גם סרוק
והוא כן נשמר כטקסט לאחר שאני סוגר ל PDF
א. אם קובץ נסרק. זה תמונה. הpdf לעולם ישאר תמונה.
לכל היותר תוכל להשתמש בocr כדי ליצור ממנו טקסט נקי ברמת אמינות זו או אחרת ואותו תצטרך לעמד מחדש. אין שום אופציה שהתמונה תהפוך לטקסט במקום התמונה. כולל עיצוב ועימוד. (יש נסיונות לכך אני חושב בתוכנות ocr מסוימות ואכמ"ל. בוודאי זה לא באינדזיין ולא בהיברובוקס.)

ב. אם הpdf הוא קובץ טקסט מקורי. הוא נשאר טקסט. ועל זה אתה מתכוון שיש כאלו שהם טקסט.
 
  • הוסף לסימניות
  • #28
נכתב ע"י eliezer;1689923:
א. אם קובץ נסרק. זה תמונה. הpdf לעולם ישאר תמונה.
לכל היותר תוכל להשתמש בocr כדי ליצור ממנו טקסט נקי ברמת אמינות זו או אחרת ואותו תצטרך לעמד מחדש. אין שום אופציה שהתמונה תהפוך לטקסט במקום התמונה. כולל עיצוב ועימוד. (יש נסיונות לכך אני חושב בתוכנות ocr מסוימות ואכמ"ל. בוודאי זה לא באינדזיין ולא בהיברובוקס.)

ב. אם הpdf הוא קובץ טקסט מקורי. הוא נשאר טקסט. ועל זה אתה מתכוון שיש כאלו שהם טקסט.

הוא מתכוון שקובץ PDF סרוק של היברובוקס, שעבר המרה, הPDF שהוא יוצר מאינדיזיין עדיין יזהה את הטקסטים.

אין לזה תועלת של צמצום הקובץ אבל אולי הוא רוצה שיוכלו לעשות חיפוש בקובץ
 
  • הוסף לסימניות
  • #29
נכתב ע"י אברהם;1689949:
הוא מתכוון שקובץ PDF סרוק של היברובוקס, שעבר המרה, הPDF שהוא יוצר מאינדיזיין עדיין יזהה את הטקסטים.

אין לזה תועלת של צמצום הקובץ אבל אולי הוא רוצה שיוכלו לעשות חיפוש בקובץ

אם כן. הרי ככה זה בא מהיברובוקס.
מה יש לעשות?! שיכניסו כמות שהוא. ותו לא.
 

פרוגבוט

תוכן שיווקי
פרסומת

הצטרפות לניוזלטר

איזה כיף שהצטרפתם לניוזלטר שלנו!

מעכשיו, תהיו הראשונים לקבל את כל העדכונים, החדשות, ההפתעות בלעדיות, והתכנים הכי חמים שלנו בפרוג!

לוח מודעות

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק כה

אלְדָוִד אֵלֶיךָ יי נַפְשִׁי אֶשָּׂא:באֱלֹהַי בְּךָ בָטַחְתִּי אַל אֵבוֹשָׁה אַל יַעַלְצוּ אֹיְבַי לִי:גגַּם כָּל קוֶֹיךָ לֹא יֵבֹשׁוּ יֵבֹשׁוּ הַבּוֹגְדִים רֵיקָם:דדְּרָכֶיךָ יי הוֹדִיעֵנִי אֹרְחוֹתֶיךָ לַמְּדֵנִי:ההַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם:וזְכֹר רַחֲמֶיךָ יי וַחֲסָדֶיךָ כִּי מֵעוֹלָם הֵמָּה:זחַטֹּאות נְעוּרַי וּפְשָׁעַי אַל תִּזְכֹּר כְּחַסְדְּךָ זְכָר לִי אַתָּה לְמַעַן טוּבְךָ יי:חטוֹב וְיָשָׁר יי עַל כֵּן יוֹרֶה חַטָּאִים בַּדָּרֶךְ:טיַדְרֵךְ עֲנָוִים בַּמִּשְׁפָּט וִילַמֵּד עֲנָוִים דַּרְכּוֹ:יכָּל אָרְחוֹת יי חֶסֶד וֶאֱמֶת לְנֹצְרֵי בְרִיתוֹ וְעֵדֹתָיו:יאלְמַעַן שִׁמְךָ יי וְסָלַחְתָּ לַעֲוֹנִי כִּי רַב הוּא:יבמִי זֶה הָאִישׁ יְרֵא יי יוֹרֶנּוּ בְּדֶרֶךְ יִבְחָר:יגנַפְשׁוֹ בְּטוֹב תָּלִין וְזַרְעוֹ יִירַשׁ אָרֶץ:ידסוֹד יי לִירֵאָיו וּבְרִיתוֹ לְהוֹדִיעָם:טועֵינַי תָּמִיד אֶל יי כִּי הוּא יוֹצִיא מֵרֶשֶׁת רַגְלָי:טזפְּנֵה אֵלַי וְחָנֵּנִי כִּי יָחִיד וְעָנִי אָנִי:יזצָרוֹת לְבָבִי הִרְחִיבוּ מִמְּצוּקוֹתַי הוֹצִיאֵנִי:יחרְאֵה עָנְיִי וַעֲמָלִי וְשָׂא לְכָל חַטֹּאותָי:יטרְאֵה אוֹיְבַי כִּי רָבּוּ וְשִׂנְאַת חָמָס שְׂנֵאוּנִי:כשָׁמְרָה נַפְשִׁי וְהַצִּילֵנִי אַל אֵבוֹשׁ כִּי חָסִיתִי בָךְ:כאתֹּם וָיֹשֶׁר יִצְּרוּנִי כִּי קִוִּיתִיךָ:כבפְּדֵה אֱלֹהִים אֶת יִשְׂרָאֵל מִכֹּל צָרוֹתָיו:
נקרא  2  פעמים
למעלה