web service המחזיר מילים נרדפות עבור מילה בעברית

  • הוסף לסימניות
  • #1
אני מחפשת web service (או כל פיתרון אחר הניתן לשימוש בשפת PHP),
שיחזיר לי מערך של מילים נרדפות עבור כל מילה בעברית שאשלח אליו.
מישהו מכיר משהו מתאים?

אני יודעת שאפשרי להשתמש ב MS WORD, ניסיתי והסתבכתי לקרוא את התוצאות.
אם מישהו התנסה בזה - אשמח מאוד
 
  • הוסף לסימניות
  • #2
אני גם רוצה.

אולי תשאלי אותם אולי ינדבו לך את הטבלאות שלהם (או אולי בתשלום).

דרך אגב, אני מתכנן לעשות תוכנה שמחשבת רמת הדמיון של הטקסטים ואודה למי שיוכל לקדם אותי במשהו (למשל נתונים סטטיסטיים - תדירות שימוש בכל מילה, סיווג לפי מילות קישור, שם תואר וכו')
 
  • הוסף לסימניות
  • #3
נכתב ע"י s976;2260096:
אני גם רוצה.

אולי נעשה עבודת צוות?
זה הקוד שניסיתי, נראה שהוא עובד אבל אני לא מצליחה לפענח את התוצאה

PHP:
 <?php
define('wdPropertyTitle', 1); 
define('wdPropertySubject', 2); 
define('wdPropertyAuthor', 3); 
define('wdPropertyKeywords', 4); 
define('wdPropertyComments', 5); 
define('wdPropertyTemplate', 6); 
define('wdPropertyLastAuthor', 7); 

$word = new COM("word.application") or die ("Could not initialise MS Word object."); 
//$word->Documents->Open(realpath("Sample.doc")); 
//$Author = $word->ActiveDocument->BuiltInDocumentProperties(wdPropertyAuthor); 

//echo $Author;
//print_r($word->WdLanguageID);_r()
//com_print_typeinfo($word->Application);echo "rivki";
$synonyms = $word->Application->SynonymInfo('שמח', 1037);
//echo $synonyms->Found ;
//echo  $synonyms->Found() . '<br/>'; // לא מדפיס פה כלום
//SafeArrayGetElement($synonyms->SynonymList,0,f);  // Call to undefined function SafeArrayGetElement()
//info("value of element0: " + AnsiString(element));
//echo ($synonyms->SynonymList); //Catchable fatal error: Object of class com_safearray_proxy could not be converted to string 
/*foreach ($synonyms->SynonymList as $obj) { 
   echo "h";
}*/
//com_print_typeinfo( $synonyms);

// Hide MS Word application window
$word->Visible = 0;

//Create new document
$word->Documents->Add();

// Define page margins 
$word->Selection->PageSetup->LeftMargin = '2';
$word->Selection->PageSetup->RightMargin = '2';

// Define font settings
$word->Selection->Font->Name = 'Arial';
$word->Selection->Font->Size = 10;

// Add text
$word->Selection->TypeText("boy");

print_r($word->Selection->Range->SynonymInfo->MeaningCount );
//$word->Selection->Range->SynonymInfo->SynonymList(1);

// Save document
//$filename = tempnam(sys_get_temp_dir(), "word");
//$word->Documents[1]->SaveAs($filename);
			   
   $classname = get_class($synonyms);
   $methods = get_class_methods($synonyms);
   $objectvars = get_object_vars($synonyms);
   
   
   echo gettype($synonyms) . "<br>";
   echo $classname . "<br>";
   print_r($methods);
   echo "<br>";
   print_r($objectvars);
echo '--';
   print_r(get_class ( $synonyms));

$word = null; 



function f() {
	echo "f()";
	
}
    ?>
 
  • הוסף לסימניות
  • #4
הקוד הנ"ל לעניות דעתי יעבוד רק בסביבת WINDOWS, המשמעות של זה - שרוב השרתים הם דווקא LINUX ואז הקוד לא יעבוד.

דבר שני, ניתן ליצור שירות כזה במידה ותמצאי/תיצרי מילון של מילים נרדפות (אפילו קובץ CSV)

ניתן ליצור קשר עם מורפיקס לעשות שת"פ http://www.morfix.co.il (אני מאמין שיש להם שירות כזה)
 
  • הוסף לסימניות
  • #6
נכתב ע"י rivkic;2260156:
אולי נעשה עבודת צוות?
זה הקוד שניסיתי, נראה שהוא עובד אבל אני לא מצליחה לפענח את התוצאה
אני מבין שהקוד הזה כאילו כל פעם פותח וורד, כותב מילה ובודק את המילים הנרדפות שלה. נראה לי שגם אם דבר כזה יעבוד, הוא יעבוד במהירות של צב.
וגם סתם, זה משהו כמו לקנות פרה בשביל כוס חלב. המילונים של המילים הנרדפות קיימים. צריך רק להשיג אחד כזה.

בכל מקרה, אם את רוצה הנה רעיון אחר. אבל לא יודע אם זה חוקי.
אז עושה בקשה (file_get_contents) לכתובת הזו.
ואז מפרססת קצת ומסתכלת מה יצא לך בתוך הקלאס הראשון בשם sr_e_txt
שוב, איני יודע אם זה חוקי.
 
  • הוסף לסימניות
  • #7
הרשיון שם הוא תחת רישיון CC ייחוס-שיתוף זהה 3.0 - שזה אומר בגדול כל עוד אתה נותן קרדיט באתר איכשהו, לכאורה אין בעיה. (אין ליחס להנ"ל ייעוץ משפטי, ויש לפנות לבעל מקצוע)
ניתן לקרוא: כאן
 
  • הוסף לסימניות
  • #8
אני מעדיפה לא להשתמש באתר אחר, זה מוצר שאני נותנת ללקוח.
אם אין ברירה, אולי באמת זה מה שאעשה.

ידוע לי של MS WORD יש קובץ ובו המילון של כל המילים הנרדפות. המאגר הזה הוא המעודכן והגדול ביותר (ככה שמעתי).
מישהו יודע על איזה קובץ מדובר?
ניסיתי לבצע חיפוש בקבצים, יש שם כמות ענקית של קבצים,
 
  • הוסף לסימניות
  • #9
נכתב ע"י rivkic;2260668:
ידוע לי של MS WORD יש קובץ ובו המילון של כל המילים הנרדפות. המאגר הזה הוא המעודכן והגדול ביותר (ככה שמעתי).
לא יודע עם המידע שקיבלת הוא מדויק. אולי זה תלוי בשפה.
אני משתמש המון עם חיפוש המילים הנרדפות ברוסית, ויכול לומר שעל כל פנים ברוסית המילון של וורד הוא חלש. לכן עם הזמן הפסקתי לגמרי להשתמש בו (יש תחליפים הרבה יותר טובים)

על כל פנים אם את רוצה לחטט בוורד, תנסי להיות בקשר עם Rרחמים הוא אוהב את הדברים האלה.
 
  • הוסף לסימניות
  • #11
נכתב ע"י s976;2260096:
אני גם רוצה.



דרך אגב, אני מתכנן לעשות תוכנה שמחשבת רמת הדמיון של הטקסטים ואודה למי שיוכל לקדם אותי במשהו (למשל נתונים סטטיסטיים - תדירות שימוש בכל מילה, סיווג לפי מילות קישור, שם תואר וכו')

יש את פרוייקט השפה של מאל"ו, אם עוזר לך במשהו:)
https://hlp.nite.org.il/WebStatisticalAnalyzer.aspx
 

פרוגבוט

תוכן שיווקי
פרסומת

פוסטים חדשים שאולי לא קראת....

הצטרפות לניוזלטר

איזה כיף שהצטרפתם לניוזלטר שלנו!

מעכשיו, תהיו הראשונים לקבל את כל העדכונים, החדשות, ההפתעות בלעדיות, והתכנים הכי חמים שלנו בפרוג!

לוח מודעות

הפרק היומי

הפרק היומי! כל ערב פרק תהילים חדש. הצטרפו אלינו לקריאת תהילים משותפת!


תהילים פרק כה

אלְדָוִד אֵלֶיךָ יי נַפְשִׁי אֶשָּׂא:באֱלֹהַי בְּךָ בָטַחְתִּי אַל אֵבוֹשָׁה אַל יַעַלְצוּ אֹיְבַי לִי:גגַּם כָּל קוֶֹיךָ לֹא יֵבֹשׁוּ יֵבֹשׁוּ הַבּוֹגְדִים רֵיקָם:דדְּרָכֶיךָ יי הוֹדִיעֵנִי אֹרְחוֹתֶיךָ לַמְּדֵנִי:ההַדְרִיכֵנִי בַאֲמִתֶּךָ וְלַמְּדֵנִי כִּי אַתָּה אֱלֹהֵי יִשְׁעִי אוֹתְךָ קִוִּיתִי כָּל הַיּוֹם:וזְכֹר רַחֲמֶיךָ יי וַחֲסָדֶיךָ כִּי מֵעוֹלָם הֵמָּה:זחַטֹּאות נְעוּרַי וּפְשָׁעַי אַל תִּזְכֹּר כְּחַסְדְּךָ זְכָר לִי אַתָּה לְמַעַן טוּבְךָ יי:חטוֹב וְיָשָׁר יי עַל כֵּן יוֹרֶה חַטָּאִים בַּדָּרֶךְ:טיַדְרֵךְ עֲנָוִים בַּמִּשְׁפָּט וִילַמֵּד עֲנָוִים דַּרְכּוֹ:יכָּל אָרְחוֹת יי חֶסֶד וֶאֱמֶת לְנֹצְרֵי בְרִיתוֹ וְעֵדֹתָיו:יאלְמַעַן שִׁמְךָ יי וְסָלַחְתָּ לַעֲוֹנִי כִּי רַב הוּא:יבמִי זֶה הָאִישׁ יְרֵא יי יוֹרֶנּוּ בְּדֶרֶךְ יִבְחָר:יגנַפְשׁוֹ בְּטוֹב תָּלִין וְזַרְעוֹ יִירַשׁ אָרֶץ:ידסוֹד יי לִירֵאָיו וּבְרִיתוֹ לְהוֹדִיעָם:טועֵינַי תָּמִיד אֶל יי כִּי הוּא יוֹצִיא מֵרֶשֶׁת רַגְלָי:טזפְּנֵה אֵלַי וְחָנֵּנִי כִּי יָחִיד וְעָנִי אָנִי:יזצָרוֹת לְבָבִי הִרְחִיבוּ מִמְּצוּקוֹתַי הוֹצִיאֵנִי:יחרְאֵה עָנְיִי וַעֲמָלִי וְשָׂא לְכָל חַטֹּאותָי:יטרְאֵה אוֹיְבַי כִּי רָבּוּ וְשִׂנְאַת חָמָס שְׂנֵאוּנִי:כשָׁמְרָה נַפְשִׁי וְהַצִּילֵנִי אַל אֵבוֹשׁ כִּי חָסִיתִי בָךְ:כאתֹּם וָיֹשֶׁר יִצְּרוּנִי כִּי קִוִּיתִיךָ:כבפְּדֵה אֱלֹהִים אֶת יִשְׂרָאֵל מִכֹּל צָרוֹתָיו:
נקרא  2  פעמים
למעלה