1. Herzlich willkommen bei WPDE.org, dem grössten und ältesten deutschsprachigen Community-Forum rund um das Thema WordPress. Du musst angemeldet oder registriert sein, um Beiträge verfassen zu können.
    Information ausblenden

Sprechendes Weblog? - www.talkingblogs.de

Dieses Thema im Forum "Plugin-Vorstellung" wurde erstellt von TheTeddy, 8. März 2007.

  1. TheTeddy

    TheTeddy Member

    Registriert seit:
    11. Juni 2006
    Beiträge:
    9
    Zustimmungen:
    0
    Hallo zusammen!

    Ich habe ein kleines Plugin gestrickt, welches es ermöglicht, Blogeinträge vorlesen zu lassen. Entstanden ist die Idee bei einem Praktikum in einer Firma, die Sprachsynthesesoftware entwickelt.

    Wenn ihr mal "hören" möchtet: talkinGBlogs

    Feedback zu der Idee und Verbesserungsvorschläge sind immer herzlich willkommen!
    :idea:
     
  2. grigley

    grigley Well-Known Member

    Registriert seit:
    3. Januar 2007
    Beiträge:
    113
    Zustimmungen:
    0
    Nachdem ich es mal getestet habe kann ich evtl. mehr sagen,
    aber auf den ersten Blick find ich`s super! :D
     
  3. k3v

    k3v Active Member

    Registriert seit:
    4. Februar 2007
    Beiträge:
    37
    Zustimmungen:
    0
  4. Monika

    Monika Well-Known Member
    Ehrenmitglied

    Registriert seit:
    4. Juni 2005
    Beiträge:
    14.126
    Zustimmungen:
    2
    Hi wann kann damit gerechnet werden, dass dieses Plugin mit jeder erdenklichen Permalink Struktur arbeitet?

    ich finde es wunderbar, aber wegen sowas gebe ich meine indezierten Links bei Google niemals auf :???:

    daher meine Frage

    lg
     
  5. mastermind

    mastermind Well-Known Member

    Registriert seit:
    13. Dezember 2005
    Beiträge:
    2.076
    Zustimmungen:
    0
    Geniale Sache, das. Ich habe auch mal versucht, eine integrierte TTS-Unterstützung für Webinhalte auf Basis von Festival zu entwickeln; das ist leider in den Kinderschuhen stecken geblieben, da ich keinen Bock hatte, einen (halbwegs fehlertoleranten) XHTML-Parser bzw. Konverter für den Festival-eigenen XML-Dialekt zu schreiben.

    Eine Frage zu dem Plugin und der darunterliegenden TTS-Software: Unter welchen Lizenzen sind die zu beziehen?
     
    #5 mastermind, 9. März 2007
    Zuletzt bearbeitet: 9. März 2007
  6. TheTeddy

    TheTeddy Member

    Registriert seit:
    11. Juni 2006
    Beiträge:
    9
    Zustimmungen:
    0
    Hallo zusammen.

    Schön, dass Euch das Plugin gefällt! :)

    zu Monika: Ich habe mich eben mal drangesetzt und die neue Version 1.2 released. Diese sollte jetzt in der Lage sein, alle 3 default-PERMALINK-Strukturen zu verarbeiten. Es kann natürlich sein, dass sich noch der eine oder andere "Käfer" eingeschlichen hat (ist schließlich im Moment eher ein quick&dirty hack), aber soweit ich es getestet habe sollte es jetzt auch mit den Standard-Permalinks funktionieren.

    zu mastermind: Lustig, dass Du Festival erwähnst ... :) Das Plugin benutzt SWIFT, ein TTS-System welches von Cepstral entwickelt wurde. Einer der Gründer von Cepstral ist Alan Black - gleichzeitig maßgeblicher Entwickler von Festival! SWIFT ist zwar von Grund auf neu programmiert, basiert aber genau wie Festival auf unit selection Mechanismen.
    Im Moment kannst Du das Plugin selbst erstmal frei downloaden und benutzen. Ich weiß noch nicht, ob ich es mal unter eine bestimmte andere Lizenz stelle. Zusätzlich brauchst Du natürlich eine sogenannte 'voice' (sprich: SWIFT, das TTS-System und eine zugehörige Stimme.).
    Diese kannst Du käuflich bei Cepstral hier erwerben. Eine Stimme kostet z.Zt. $29,99. Du kannst z.B. per Paypal oder Kreditkarte bezahlen.
    Offiziell bräuchtest Du für die Synthese von Blog-Artikeln noch eine sogenannte 'Audio Distribution License' für $199,99:
    "An Audio Distribution License (ADL) provides rights to publish audio created using a Cepstral voice. This includes the rights to distribute audio files containing Cepstral voice output via email, web site, telephone, audio CD, Flash Animation, or any other media, physical or electronic. ADLs are sold on a per-voice basis. That is, a single ADL gives you permission to distribute the output of a single voice. To distribute the audio of several voices, you must purchase several ADLs - one for each voice."
    Wenn Du wirklich Interesse hast könntest Du ja mal bei denen anfragen, ob Du Dein privates Blog auch ohne ADL synthetisieren darfst (verweis in einer evtl. mail dann am besten auf mein talkinGBlogs-Plugin). Ob das möglich ist kann ich Dir leider so nicht sagen.
    Ausprobieren könntest Du das Ganze auf jeden Fall erstmal mit einer Trial-Voice. Da wird dann in jeden Satz, den Du synthetisierst eingebunden "dies ist eine Demo-Stimme" oder so ...

    Sollte das Plugin auf wirklich reges Interesse stoßen, und sollte Cepstral das auch mitbekommen, dass das für die Wordpress-Gemeinde eine interessante Sache ist, müsste ich vielleicht bzgl. Lizenzen mal selbst mit denen sprechen. Das lohnt sich aber erst dann, wenn wirklich einige/ein paar mehr Leute Interesse haben. Also: macht Werbung dafür! :grin:

    Vielen Dank auf jeden Fall schonmal für Eure Rückmeldungen. Weitere Tipps sind gerne willkommen.
    :)
     
  7. mastermind

    mastermind Well-Known Member

    Registriert seit:
    13. Dezember 2005
    Beiträge:
    2.076
    Zustimmungen:
    0
    Interessant... schade, dass Festival so vor sich hindümpelt. Ist eine gute Software, die aber anscheinend nur als Forschungsprojekt entwickelt wurde. Derzeit kompiliert es noch nicht mal mit GCC 4.x. :(

    Ich habe natürlich volles Verständnis, dass ein Hersteller für Spezialsoftware seine Produkte durch Lizenzkosten refinanziert. Aber ich befürchte, es wird kaum ein Blogger bereit sein, 30 oder gar 230 Euro für den Spaß zu bezahlen. Ebenso lockt man mit -- verzeih mir den Ausdruck -- verkrüppelten Demos keinen Blogger mehr hinter dem Ofen vor -- in Zeiten, da im Web von Bürosoftware bis Webspace praktisch alles kostenlos zu haben ist.

    Wenn Cepstral wirklich Interesse an einer Verbreitung im Massenmarkt hat, sollten sie vielleicht anders ansetzen -- nämlich Blogger und Co. nicht als Kunden sehen (ist ohnehin illusorisch), sondern als Multiplikatoren. Ich möchte fast garantieren, dass eine kostenlose, halbwegs vollwertige Variante der Software in kürzester Zeit eine Publicity und Verbreitung der Software generieren würde, für die eine PR-Agentur ganz schön schwitzen müsste. Wie gesagt, nur mal als Idee -- müsste man sicher noch dran feilen.
     
  8. TheTeddy

    TheTeddy Member

    Registriert seit:
    11. Juni 2006
    Beiträge:
    9
    Zustimmungen:
    0
    Das sehe ich ein wenig anders ... Überleg mal: $30 - das sind beim aktuellen Dollarkurs gerade mal ca. 23€, das zahlst Du heutzutage schon fast, wenn Du zu 2. ins Kino gehst incl. ner großen Cola und Popcorn. Das finde ich beim Besten Willen nicht zuviel. Dass wir über 230€ nicht reden müssen versteht sich natürlich von selbst. Das würde ich für mein privates Blog auch nicht ausgeben - bei kommerziell genutzten Blogs schon wieder was ganz anderes ...
    Da Cepstral nicht über das Blog-Geschäft in den Markt will, sondern schon gut und fest im Markt vertreten ist, ist das Blog-Geschäft überhaupt nicht deren primäres Ziel. Wie gesagt, das war eine Idee von mir, deren System mit Wordpress zu verbinden - mehr nicht.

    Falls jemand das Plugin wirklich mal mit seinem Blog testen sollte (funktioniert ja wie gesagt mit der Demo-Version die NICHT zum Produktiv-Einsatz gedacht ist, sondern lediglich dazu dienen kann zu testen, ob die Applikation überhaupt auf Eurem Webspace funktioniert) wäre ich für Rückmeldungen dankbar. Vielleicht könnte man auch auf talkinGBlogs ein Blogroll einrichten mit Blogs, die das Plugin nutzen ...

    Viel Spaß weiterhin damit.
    Gruß,
    TheTeddy
     
  9. mastermind

    mastermind Well-Known Member

    Registriert seit:
    13. Dezember 2005
    Beiträge:
    2.076
    Zustimmungen:
    0
    Ich glaube, Du hast nicht ganz verstanden, worauf ich hinaus wollte. Vielleicht habe ich es auch nicht klar genug ausgedrückt.

    Klar, 30 USD sind sicher ein angemessener Preis für eine solche Software. Allerdings würden die meisten Leute es nicht mal kaufen, wenn es nur einen Dollar kosten würde: Es ist für die meisten nicht mehr als ein lustiges Gimmick, und die ganze Abwicklung des Kaufs wäre schon zu viel des Aufwands.

    Ich denke natürlich auch nicht, dass Cepstral ins Blog-Geschäft einsteigen will. Wäre ja auch Quark. Aber genau deshalb meine ich, dass man dennoch eine Symbiose mit der Blogosphäre eingehen könnte: Den Leute, die als Kunden ohnehin nicht in Frage kommen, kann man eine kostenlose, am besten nicht technisch eingeschränkte Version zu bestimmten Konditionen (Backlink o.ä.) geben. Der Gewinn ist der PR-Faktor, der je nach Herangehensweise sicher beachtlich wäre und garantiert auch Auswirkungen auf die primären Geschäftsfelder hätte. Das klappt bei anderen Produkten wie etwa VMware ja auch.

    Aber ich kann natürlich auch verstehen, wenn man als eher konservatives Unternehmen diesen Schritt scheut. Aber man soll sich lieber keine Illusionen machen, dass man im Massenmarkt ernsthaft was verkaufen kann -- auch nicht mit durchaus angemessenen Preisen.

    Im Endeffekt ist es nur ein kleiner Denkanstoß von mir, ich selbst würde das ohnehin nicht nutzen. Zum einen passt es zu keiner meiner Webseiten, zum anderen nutze ich aus Prinzip nur OpenSource-Software.

    Wobei mich das wieder auf eine Idee bringt... vielleicht sollte ich doch noch ein wenig mit Festival rumspielen und eine OpenSource-Variante von talkingBlogs schaffen. ;)
     
    #9 mastermind, 21. März 2007
    Zuletzt bearbeitet: 21. März 2007
  10. TheTeddy

    TheTeddy Member

    Registriert seit:
    11. Juni 2006
    Beiträge:
    9
    Zustimmungen:
    0
    Eine "OpenSource-Variante", wie Du sie nennst (ich gehe mal davon aus, dass Du damit die zugrundeliegende TTS-Engine meinst, die "frei" sein muss) stricke ich Dir in einer Stunde hinter das Plugin. Tipp: Mach Dir nicht die Mühe mit Festival, nimm z.B. MBROLA (ist zwar kein unit-selection system sondern diphone-basiert, liefert aber auch audio-content). Das hast Du in 15 Minuten am laufen. Danach schreibst Du dir ein Skript mit nen paar LTS-rules, die die grapheme2phoneme Konvertierung zur PHO-file Generierung übernehmen und legst danach eine übliche Intonationskurve über die Phonemsequenz. Schon hast Du ein "freies" TTS-Plugin.

    ABER: Darum geht es nicht. Ich weiß nicht, inwieweit Du Dich linguistisch mit dem ganzen Thema auskennst, aber Evaluationskriterien für solche Systeme sind unter Anderem Verständlichkeit und Natürlichkeit der Sprache - hast Du Dir schonmal überlegt, warum TTS noch lange nicht im Alltagsleben angekommen ist? Eben weil die Systeme noch lange nicht "natürlich" klingen. Und genau dort liegt der Hase im Pfeffer: Zeig mir ein frei verfügbares System, welches annähernd die Qualität von kommerziellen Systemen (wie dem von Cepstral) bietet. Du wirst immer einen gewissen, bei MBROLA abhängig von Deinem Preprocessing-Skript sogar recht hohen Grad an Monotonie in den freien synthetischen Stimmen finden - und das will der eifrige Endkunde (in unserem Fall die vielen Blogger da draußen) nicht. Willst Du Dein Blog von einem "Roboter" vorgelesen bekommen? Also dann würde ich es lieber ganz sein lassen.

    Ich denke, die Diskussion führt gerade etwas am Thema hier vorbei, denn eigentlich sollen in diesem Forum ja neue Plugins und deren Entwicklung vorgestellt werden ...

    Falls Du aber wirklich ein System mit einer "freien" TTS-Engine zusammenstrickst bin ich sehr an den Ergebnissen interessiert!

    Allen anderen Lesern wünsche ich weiterhin viel Spaß mit dem original talkinGBlogs-Plugin ... ;)
     
  11. mastermind

    mastermind Well-Known Member

    Registriert seit:
    13. Dezember 2005
    Beiträge:
    2.076
    Zustimmungen:
    0
    Nun ja, ich würde es mir insofern noch einfacher machen, als ich mich mit dem Backend gar nicht beschäftigen würde, sondern nur einen Wrapper für eine fertige TTS-Engine schreiben. MBROLA kenne ich und finde ich auch ganz nett, aber zum einen steht es nicht unter einer freien Lizenz, zum anderen wüsste ich nicht, warum ich MBROLA Festival vorziehen sollte. (Das liegt aber daran, dass ich MBROLA zu wenig kenne.) Letztendlich kann man MBROLA-Stimmen ja auch mit Festival nutzen.

    Ich kenne mich mit den Basics aus; kann also mit Begriffen wie Phonem, Formant(-ansatz), etc. durchaus was anfangen. (Hatte in der Uni mal ein Hauptseminar zum Thema Sprache.) Aber ich bin natürlich kein Fachmann. Dass die Qualität von Festival und MBROLA mit den TTS-Anwendungen jüngeren Datums nicht konkurrieren können, ist mir natürlich auch klar -- ich würde nie behaupten, dass Festival eine Konkurrenz zu Cepstral darstellen könnte. Ich hatte auch schon das Vergnügen, JAWS und Blindows zu erleben, und ich bin wirklich beeindruckt von der verhältnismäßig natürlichen Sprachwiedergabe. Wie auch immer -- ich glaube, dass eine eher simple, dafür aber kostenlose TTS-Engine bei Bloggern (zahlenmäßig) auf mehr Interesse stoßen würde als eine bessere und kommerzielle.

    Nö, wieso... ich denke, wir sind mitten drin im Thema. ;)

    Naja, meine Ankündigung war nicht so ganz ernst gemeint. Aber vielleicht habe ich demnächst ja ein paar müßige Stunden und mache mich mal dran. :)


    lol, keine Sorge... ich werde Dir weder Namen noch Inhalt Deiner Lösung streitig machen. ;)
     
  12. tts

    tts Member

    Registriert seit:
    18. Mai 2007
    Beiträge:
    20
    Zustimmungen:
    0
    Damm meldet sich hier auch mal schnell die Konkurrenz zu Wort! ;)

    Wir bieten ebenfalls ein Plugin an, das Blogeinträge in Sprache übersetzt - und das mit einer sehr guten Sprachqualität (und kostenlos).

    Wer mehr wissen möchte: www.talkingtext.de

    Schönen Tag noch! :)
     
  13. TheTeddy

    TheTeddy Member

    Registriert seit:
    11. Juni 2006
    Beiträge:
    9
    Zustimmungen:
    0
    Hey tts ... Ich würde das nicht als "Konkurrenz" bezeichnen ... Ihr habt eine ganz andere (kommerzielle) Strategie. Ihr finanziert Euch über Werbung, sammelt Daten von Kunden, erlaubt "nur" 8 Blogeinträge zu synthetisieren bei neuen Blogs ... Außerdem sind Eure Kunden immer abhängig von Eurem System, da die Sythese auf Euren Servern läuft wie ich gesehen habe ...
    Aus kommerzieller Sicht sicherlich genau der richtige Weg (siehe andere kommerzielle Systeme wie z.B. Readspeaker die genauso verfahren) ...

    talkinGBlogs funktionert komplett auf dem eigenen Webspace - es ist sicherlich nicht so einfach einzubinden wie Euer Plugin, und die hochwertige TTS-Engine im Hintergrund kostet Geld ... Wenn es aber läuft ist man vollkommen unabhängig von anderen Webservern, und: man hat seine personenbezogenen Daten nicht herausgegeben. ;)

    Jeder sollte selbst entscheiden, was ihm lieber ist ... :)

    Mein Plugin ist zu rein wissenschaftlichen Zwecken entwickelt worden (entwickelt im Frühjahr 2006 - vorgestellt auf einer Computerlinguistik-Konferenz im September) ... Dass das TTS-System Geld kostet liegt nicht in meiner Hand, ich biete kein kommerzielles all-in-one package an so wie ihr, sondern gebe lediglich die Möglichkeit, durch das Plugin ein Blog unter Zuhilfenahme eines hervorragenden TTS-Systems zu synthetisieren.

    Über die Sprachqualität müsste man allerdings mal diskutieren. Ich weiß nicht, welche TTS-Engine ihr einsetzt (sicherlich auch eine "zugekaufte", und keine eigene, oder?!) ...
    Allerdings würde mich interessieren, warum hinter all Euren synthetisierten Einträgen Musik hinterliegt?!
    Ein Schelm, der denkt, dass das der Fall ist um "schlechte" joins (sofern ihr ein Unit-selection System einsetzt) zu verschleiern. ;)

    Viel Erfolg weiterhin (aus wissenschaftlicher Sicht bin ich zugegeben etwas neidisch auf das riesige Lexikon was ihr "nebenbei" und quasi kostenfrei durch Eure "User-machen-mit"-Strategie von den Benutzern erstellen lasst - guter Einfall!) :)

    Gruß
    talkinGBlogs
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden