C-Programm für das Lesen von doc -, docx -, pdf -

Ich möchte ein Programm schreiben in C(nur c, nicht c++ oder java), das Lesen von doc -, docx -, pdf-und wollen es auf github für alle, die Bedürfnisse, die code. So begann ich mit .doc Datei, die ich erkundet, dass wenn ich offen .doc-Datei mit dem einfachen Editor wird es Ihnen zeigen, allen text, sondern nur mit einigen extra-Inhalten, die Sie leicht zu schneiden. Also geschrieben habe ich ein einfaches c-Programm zu Lesen .doc wile in beiden 'r' und 'rb' - Modus, aber beide mal, es gibt mir nur 5-9 Zeichen in der Datei und diese auch nicht lesbar sind. Ich weiß nicht, warum es passiert. Jeder Kommentar oder disccussion wird sehr hilfreich für mich.

Hier ist der link zum github Source code. Bitte helfen Sie mir, um alle drei format.

  • All diese Formate verwenden unterschiedliche Kodierungen, die Sie haben, um Sie nachschlagen. Es ist nicht so einfach wie das Lesen der Datei mit fopen und drucken es leider nicht.
  • Ich weiß schon, dass und studierte auch über Sie, wie gesagt, mein Erstes problem ist das Lesen .doc. Meine Frage hier ist, warum ich in der Lage bin, den text zu Lesen aus .doc, während ich bin, öffnen Sie notepad oder einem anderen text-editor, aber nicht im C-Programm ?
  • Es ist sehr schlechte form zu ändern, Ihre Frage in diesem Ausmaß. Auf diese Weise sind Sie grundsätzlich a) nicht zu geben, zu wem findet das problem, das Sie hatte in Ihrem code und b) Sie machen alle von den Antworten, die völlig nutzlos und unverständlich für spätere Leser (weil Sie umgezogen auf eine neue Frage von Ihr bearbeitet. Bitte stellen Sie neue Fragen in einem neuen Frage, nicht, indem Sie Ihre bestehenden!
  • Ich bin nicht die änderung der Frage . Die Frage ist, wie zu Lesen, doc fox und PDF-Format in c
  • Ihre ursprüngliche Frage war, warum dein Codefragment nicht gelesen haben, die Datei richtig, aber gestoppt. Die ich antwortete. Nach dem Sie den code in etwas völlig anderes. Wenn Sie jetzt die besagt, dass Ihre Frage ist insgesamt, wie zu Lesen, diese drei Formate, werde ich Flagge für allzu breit, was es ist.
  • Ich weiß, dass Sie gab hilfreiche Antwort zu posten, aber es hat nicht vollständig gelöst ist das problem möchte ich zum Abschluss alle drei format hier nicht wollen, Fragen Sie dieselbe Frage wieder neu und unter Risiko, markieren Sie den thread als Duplikat, ich bin nah genug, um zu lösen das erste problem ist, bitte mit mir zusammenarbeiten
  • Ihr - wieder editiert - Frage noch-Staaten ", Also geschrieben habe ich ein einfaches c-Programm zu Lesen .doc wile in beiden 'r' und 'rb' - Modus, aber beide mal, es gibt mir nur 5-9 Zeichen in der Datei und diese auch nicht lesbar". Diese Frage wird beantwortet. Helfen Sie fix ein vollständiges Wort -, docx-und PDF-parser in C ist viel zu breit für eine Frage bei StackOverflow - ich habe markiert Ihre Frage als zu breit, zu beantworten. Das Recht, was zu tun ist, um zu implementieren Sie den code und kommen zurück mit spezifischen, engeren Fragen. Die Regeln auf dieser Website, um die Dinge überschaubar und interessant - bitte befolgen Sie Sie.

Schreibe einen Kommentar