iTextSharp 5 polnischen Charakter

Problem habe ich mit polnischen Zeichen unter Verwendung itextSharp. Ich möchte zum erstellen von pdf aus html. Alles funktioniert gut, aber die polnischen Zeichen fehlen. Ich benutze die Funktion lower:

    private void createPDF(string html)
    {
        //MemoryStream msOutput = new MemoryStream();
        TextReader reader = new StringReader(html);//step 1: creation of a document-object
        Document document = new Document(PageSize.A4, 30, 30, 30, 30);

        //step 2:
        //we create a writer that listens to the document
        //and directs a XML-stream to a file
        PdfWriter writer = PdfWriter.GetInstance(document, new FileStream("Test.pdf", FileMode.Create));

        //step 3: we create a worker parse the document
        HTMLWorker worker = new HTMLWorker(document);

        //step 4: we open document and start the worker on the document
        document.Open();
        worker.StartDocument();

        //step 5: parse the html into the document
        worker.Parse(reader);

        //step 6: close the document and the worker
        worker.EndDocument();
        worker.Close();
        document.Close();
    }

Und Versuchen Sie es verwenden:

createPDF("ĄąćęĘłŁŃńóÓŚśŹźŻż");

Ich versuche set:

BaseFont bf = BaseFont.CreateFont(BaseFont.TIMES_ROMAN, Codierung.UTF8.HeaderName, BaseFont.EMBEDDED);

        writer.DirectContent.SetFontAndSize(bf, 16);

Aber es doesnt Arbeit

Haben Sie eine Idee????

Hinsichtlich

InformationsquelleAutor dzajdol | 2011-02-04

c#itextsharp

Nur zu Rollen zusammen, was @Mark Storer sagte:

private void createPDF(string html)
{
    //MemoryStream msOutput = new MemoryStream();
    TextReader reader = new StringReader(html);//step 1: creation of a document-object
    Document document = new Document(PageSize.A4, 30, 30, 30, 30);

    //step 2:
    //we create a writer that listens to the document
    //and directs a XML-stream to a file
    PdfWriter writer = PdfWriter.GetInstance(document, new FileStream("Test.pdf", FileMode.Create));

    //step 3: we create a worker parse the document
    HTMLWorker worker = new HTMLWorker(document);

    //step 4: we open document and start the worker on the document
    document.Open();

    //step 4.1: register a unicode font and assign it an allias
    FontFactory.Register("C:\\Windows\\Fonts\\ARIALUNI.TTF", "arial unicode ms");

    //step 4.2: create a style sheet and set the encoding to Identity-H
    iTextSharp.text.html.simpleparser.StyleSheet ST = New iTextSharp.text.html.simpleparser.StyleSheet();
    ST.LoadTagStyle("body", "encoding", "Identity-H");

    //step 4.3: assign the style sheet to the html parser
    worker.Style = ST;

    worker.StartDocument();

    //step 5: parse the html into the document
    worker.Parse(reader);

    //step 6: close the document and the worker
    worker.EndDocument();
    worker.Close();
    document.Close();
}

Und wenn Sie es nennen wickeln Sie Ihren text in einer Schrift mit dem Namen Sie sich registriert oben:

createPDF("<font face=""arial unicode ms"">ĄąćęĘłŁŃńóÓŚśŹźŻż</font>");

Das sieht gut aus, ja. Sie sollten in der Lage sein, um den Standard-Gesicht auf die gleiche Weise.
Chris Hass - Sie sind die besten. Nach ein paar Stunden struggleing Ihre Antwort gab mir die breakthourgh, die ich brauchte!

InformationsquelleAutor Chris Haas

7

BEKAM ICH DIE ANTWORT! =) (speziell für die polnische) ich fühle mich verpflichtet, es hier in diesem alten thread, da bin ich mir sicher, dass ich nicht der Letzte sein, um es zu finden.

Ich bin schwer enttäuscht, dass es keine guten Antworten auf diese... die meisten von Ihnen schlagen vor, mit der ARIALUNI.TTF im Windows-FONTS-Ordner, die Ergebnisse in einer PDF-Datei um ein Vielfaches größer. Die Lösung muss nicht so drastisch sein...

Viele andere schlagen vor, Beispiele zeigt die Kodierung cp1252 was nicht auf Arial und nicht Helvetica für den polnischen text.

Verwende ich iTextSharp 4.1.6... der trick ist... cp1257! Und Sie können es verwenden, mit BaseFont.Kurier -, BaseFont.Helvetica, BaseFont.Times-Roman

Das funktioniert... und meine PDF-Dateien sind klein (3kb!)
```
document.Open();
var bigFont = FontFactory.GetFont(BaseFont.COURIER, BaseFont.CP1257, 18, Font.BOLD);
var para = new Paragraph("Oryginał", bigFont);
document.Add(pgDocType);
document.Close();
```
Testen werde ich später und stellen Sie sicher, ich kann Sie öffnen und Lesen Sie diese in Windows XP und Mac OSX neben Windows 7.

nur ein update... stick mit Helvetica oder Times New Roman und CP1257. Ich war mit Kurier-und es stellt sich heraus, dass einige ältere Versionen von adobe reader nicht das anzeigen der polnische Akzent s und z ist.
Wie hast du BaseFont.CP1257? Ich bin auf der Suche richtigen code für Kroatisch/Bosnisch . Ich habe teilweise Unterstützung, mit Ihrem code ,der für die Buchstaben. Dank
Vielleicht verwenden Sie eine andere version von itextsharp? Ich bin mit 4.1.6, da version 5 hat verschiedene Lizenzen. CP1257 sollte innerhalb Basefont... nichts besonderes hier zu tun. Am Ende, die ich verwendet, CP1257 und Times new Roman. Es wurde am "sichersten", so dass alle PDF-Viewer öffnen konnte und auch die Dateigröße war immer noch winzig.

InformationsquelleAutor Ralph N
2

Beim erstellen Ihrer BaseFont müssen Sie angeben, dass Sie möchten, um UniCode-Zeichen verwenden. Diese Antwort zeigt, wie.

InformationsquelleAutor Stewbob

Als stöberte ich in verschiedenen Foren und stackoverflow-Fragen fand ich keine Antwort mit einer komplexen Lösung, um das Sonderzeichen-problem. Ich habe versucht, zur Verfügung zu stellen im Austausch gegen eine ziemlich lange Antwort auf die Frage. Hoffentlich hilft das jemanden...

Benutzte ich die XMLWorker aus SourceForge als HtmlWorker wurde depricated. Das problem mit Sonderzeichen blieb Gedanke. Ich fand zwei Lösungen, die wirklich funktionieren und können beide verwendet werden, separat und kombiniert.

HTML & CSS-Lösung

Jeden tag beteiligt haben müssen, schriftart-Familie Stil, in der Reihenfolge angegeben werden, richtig interpretiert ParseXHtml Methode (ich bin nicht sicher, warum verschachtelte tag-Stilen Vererbung funktioniert hier nicht, aber es scheint, dass es wirklich nicht oder es funktioniert nicht vollständig).

Diese Lösung ermöglicht das ändern der resultierenden PDF-Datei basiert auf der HTML-code nur, damit einige Szenarien, ohne code neu kompilieren, stattfinden könnte.

Vereinfachte code (für eine MVC-app) möchte, dass sein:

Controller:

public FileStreamResult GetPdf()
{
    const string CONTENT_TYPE = "application/pdf"
    var fileName = "mySimple.pdf";
    var html = GetViewPageHtmlCode();
    //the way how to capture view HTML are described in other threads, e.g. [here][2]
    var css = Server.MapPath("~/Content/Pdf.css");
    using (var capturedActionStream = new MemoryStream(USED_ENCODING.GetBytes(html)))
    {
        using (var cssFile = new FileStream(css),  FileMode.Open))
        {
            var memoryStream = new MemoryStream();
            //to create landscape, use PageSize.A4.Rotate() for pageSize
            var document = new Document(PageSize.A4, 30, 30, 10, 10);
            var writer = PdfWriter.GetInstance(document, memoryStream);
            var worker = XMLWorkerHelper.GetInstance();

            document.Open();
            worker.ParseXHtml(writer, document, capturedActionStream, cssFile);
            writer.CloseStream = false;
            document.Close();
            memoryStream.Position = 0;

            //to enforce file download
            HttpContext.Response.AddHeader(
                "Content-Disposition",
                String.Format("attachment; filename={0}", fileName));
            var wrappedPdf = new FileStreamResult(memoryStream, CONTENT_TYPE);
            return wrappedPdf;
        }
    }
}

CSS:

body {
    background-color: white;
    font-size: .85em;
    font-family: Arial;
    margin: 0;
    padding: 0;
    color: black;
}

p, ul {
    margin-bottom: 20px;
    line-height: 1.6em;
}

div, span {
    font-family: Arial;
}

h1, h2, h3, h4, h5, h6 {
    font-size: 1.5em;
    color: #000;
    font-family: Arial;
}

Ansicht-layout

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <meta http-equiv="content-type" content="text/html; charset=utf-8"/>
        <title>@ViewBag.Title</title>
        <link href="@Url.Content("~/Content/Pdf.css")" rel="stylesheet" type="text/css" />
    </head>
    <body>
        <div class="page">
            <div id="main">
                @RenderBody()
            </div>
        </div>
    </body>
    </html>

Anzeigen Seite

@{
    ViewBag.Title = "PDF page title"
}

<h1>@ViewBag.Title</h1>

<p>
    ěščřžýáíéů ĚŠČŘŽÝÁÍÉŮ
</p>

Innen-code-schriftart-ersetzen-Lösung

In dieser Lösung ist die schriftart zurückgegeben, die durch eine IFontProvider geändert, um die eine enthält die (richtige) Darstellung von Sonderzeichen und BaseFont.IDENTITY_H Kodierung verwendet wird. Vorteil des Ansatzes ist, dass es genau eine schriftart, die verwendet wird. Dies ist auch der Nachteil in der Art.

Auch, diese Lösungen erwartet, die Schrift ist ein Teil des Projekts (*.ttf-Datei(en) in Content/Fonts Ordner).

Alternativ können Sie die Schriftarten können abgerufen werden von Windows-Schriftarten Ort: Environment.GetFolderPath(Environment.SpecialFolder.Fonts) - das erfordert wissen (oder die Feste überzeugung) von Schriftarten auf dem server installiert oder Kontrolle über den server

`FontProvider` (über `FontFactory`)

Nahm ich meine Freiheit zu erweitern Gregor S Lösung ein bisschen, dass bietet mehr komplexe FontFactory, die verwendet werden können für eine Vielzahl von HTML-Vorlagen" durchgeboxt XMLWorker.

public class CustomFontFactory : FontFactoryImp
{
    public const Single DEFAULT_FONT_SIZE = 12;
    public const Int32 DEFAULT_FONT_STYLE = 0;
    public static readonly BaseColor DEFAULT_FONT_COLOR = BaseColor.BLACK;

    public String DefaultFontPath { get; private set; }
    public String DefaultFontEncoding { get; private set; }
    public Boolean DefaultFontEmbedding { get; private set; }
    public Single DefaultFontSize { get; private set; }
    public Int32 DefaultFontStyle { get; private set; }
    public BaseColor DefaultFontColor { get; private set; }

    public Boolean ReplaceEncodingWithDefault { get; set; }
    public Boolean ReplaceEmbeddingWithDefault { get; set; }
    public Boolean ReplaceFontWithDefault { get; set; }
    public Boolean ReplaceSizeWithDefault { get; set; }
    public Boolean ReplaceStyleWithDefault { get; set; }
    public Boolean ReplaceColorWithDefault { get; set; }

    public BaseFont DefaultBaseFont { get; protected set; }

    public CustomFontFactory(
        String defaultFontFilePath,
        String defaultFontEncoding = BaseFont.IDENTITY_H,
        Boolean defaultFontEmbedding = BaseFont.EMBEDDED,
        Single? defaultFontSize = null,
        Int32? defaultFontStyle = null,
        BaseColor defaultFontColor = null,
        Boolean automaticalySetReplacementForNullables = true)
    {
        //set default font properties
        DefaultFontPath =  defaultFontFilePath;
        DefaultFontEncoding = defaultFontEncoding;
        DefaultFontEmbedding = defaultFontEmbedding;
        DefaultFontColor = defaultFontColor == null
            ? DEFAULT_FONT_COLOR
            : defaultFontColor;
        DefaultFontSize = defaultFontSize.HasValue
            ? defaultFontSize.Value
            : DEFAULT_FONT_SIZE;
        DefaultFontStyle = defaultFontStyle.HasValue
            ? defaultFontStyle.Value
            : DEFAULT_FONT_STYLE;

        //set default replacement options
        ReplaceFontWithDefault = false;
        ReplaceEncodingWithDefault = true;
        ReplaceEmbeddingWithDefault = false;

        if (automaticalySetReplacementForNullables)
        {
            ReplaceSizeWithDefault = defaultFontSize.HasValue;
            ReplaceStyleWithDefault = defaultFontStyle.HasValue;
            ReplaceColorWithDefault = defaultFontColor != null;
        }

        //define default font
        DefaultBaseFont = BaseFont.CreateFont(DefaultFontPath, DefaultFontEncoding, DefaultFontEmbedding);

        //register system fonts
        FontFactory.RegisterDirectories();
    }

    protected Font GetBaseFont(Single size, Int32 style, BaseColor color)
    {
        var baseFont = new Font(DefaultBaseFont, size, style, color);

        return baseFont;
    }

    public override Font GetFont(String fontname, String encoding, Boolean embedded, Single size, Int32 style, BaseColor color, Boolean cached)
    {
        //eventually replace expected font properties
        size = ReplaceSizeWithDefault
            ? DefaultFontSize
            : size;
        style = ReplaceStyleWithDefault
            ? DefaultFontStyle
            : style;
        encoding = ReplaceEncodingWithDefault
            ? DefaultFontEncoding
            : encoding;
        embedded = ReplaceEmbeddingWithDefault
            ? DefaultFontEmbedding
            : embedded;

        //get font
        Font font = null;
        if (ReplaceFontWithDefault)
        {
            font = GetBaseFont(
                size,
                style,
                color);
        }
        else
        {
            font = FontFactory.GetFont(
                fontname,
                encoding,
                embedded,
                size,
                style,
                color,
                cached);

            if (font.BaseFont == null)
                font = GetBaseFont(
                    size,
                    style,
                    color);
        }

        return font;
    }
}

Controller

private const String DEFAULT_FONT_LOCATION = "~/Content/Fonts";
private const String DEFAULT_FONT_NAME = "arialn.ttf";

public FileStreamResult GetPdf()
{
    const string CONTENT_TYPE = "application/pdf"
    var fileName = "mySimple.pdf";
    var html = GetViewPageHtmlCode();
    //the way how to capture view HTML are described in other threads, e.g. 
    var css = Server.MapPath("~/Content/Pdf.css");
    using (var capturedActionStream = new MemoryStream(USED_ENCODING.GetBytes(html)))
    {
        using (var cssFile = new FileStream(css),  FileMode.Open))
        {
            var memoryStream = new MemoryStream();
            var document = new Document(PageSize.A4, 30, 30, 10, 10);
            //to create landscape, use PageSize.A4.Rotate() for pageSize
            var writer = PdfWriter.GetInstance(document, memoryStream);
            var worker = XMLWorkerHelper.GetInstance();
            var defaultFontPath = Server
                .MapPath(Path
                    .Combine(
                        DEFAULT_FONT_LOCATION,
                        DEFAULT_FONT_NAME));
            var fontProvider = new CustomFontFactory(defaultFontPath);

            document.Open();
            worker.ParseXHtml(writer, document, capturedActionStream, cssFile, fontProvider);
            writer.CloseStream = false;
            document.Close();
            memoryStream.Position = 0;

            //to enforce file download
            HttpContext.Response.AddHeader(
                "Content-Disposition",
                String.Format("attachment; filename={0}", fileName));
            var wrappedPdf = new FileStreamResult(memoryStream, CONTENT_TYPE);
            return wrappedPdf;
        }
    }
}

CSS:

body {
    background-color: white;
    font-size: .85em;
    font-family: "Trebuchet MS", Verdana, Helvetica, Sans-Serif;
    margin: 0;
    padding: 0;
    color: black;
}

p, ul {
    margin-bottom: 20px;
    line-height: 1.6em;
}

h1, h2, h3, h4, h5, h6 {
    font-size: 1.5em;
    color: #000;
}

Ansicht-layout

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <meta http-equiv="content-type" content="text/html; charset=utf-8"/>
        <title>@ViewBag.Title</title>
        <link href="@Url.Content("~/Content/Pdf.css")" rel="stylesheet" type="text/css" />
    </head>
    <body>
        <div class="page">
            <div id="main">
                @RenderBody()
            </div>
        </div>
    </body>
    </html>

Anzeigen Seite

@{
    ViewBag.Title = "PDF page title"
}

<h1>@ViewBag.Title</h1>

<p>
    ěščřžýáíéů ĚŠČŘŽÝÁÍÉŮ
</p>

Andere nützliche (re)Quellen:

Lange Antwort, aber nützlich. Encoding-Probleme Weg.:)

InformationsquelleAutor Matt Stuvysant

1

1) iText 5.0.6 wurde heute veröffentlicht mit einer umfangreichen überarbeitung der HTML->PDF-Konvertierung-code. Ich schlage vor, Sie versuchen den neuen code statt.

2) ich bin mir fast sicher, dass die Einstellung der directContent wie, nicht auf das pdf-Inhalte, die von HTMLWorker. Ich bin mir zu 99% sicher, dass es dann [neu]legen Sie die schriftart, bevor es zieht einen beliebigen text.

3) Versuchen Sie, wickeln Sie Ihre string in <font face="AFontThatActuallyContainsThoseCharacters"> - tags. Ich bezweifle, dass die Standard-schriftart HTMLWorker picks up für den job.

NÖ. Der Standardwert ist Helvetica mit WinAnsiEncoding. Definitiv nicht geeignet, um etwas außerhalb der typischen Englisch/Deutsch/Französisch/Spanisch.

Sollten Sie in der Lage sein zu verwenden HTMLWorker.setStyleSheet um einige freundlichere Vorgaben. Sie sollten das "Gesicht" und "encoding", um etwas mehr Polnisch-Freundlich. Ich empfehle "Identity-H" für die Codierung, das gibt Ihnen Zugriff zu allen Zeichen in der schriftart, die Sie gehen mit, unabhängig von der Sprache. Für eine Schrift, es gibt ein Programm namens "charmap.exe" in windows seit WayBack, die Ihnen zeigen, welche Zeichen eine schriftart zur Verfügung hat, in einer bestimmten Kodierung (inklusive unicode). Die Produktfamilie "Arial" sieht gut aus, wie einige andere.

"der neue code" wohl nicht ändern, ein Verhalten, das Sie beobachten. Es ist ein refactoring zu machen, die Zukunft (in der nächsten release so wie ich es verstehe) Veränderungen leichter.

Mein Vorschlag ist, gehen Sie mit setStyleSheet():
```
   //step 3: we create a worker parse the document
   HTMLWorker worker = new HTMLWorker(document);

   StyleSheet sheet = new StyleSheet;

   HashMap<String, String> styleMap = new HashMap<String, String>();
   styleMap.put("face", "Arial"); //default font
   styleMap.put("encoding", "Identity-H"); //default encoding

   String tags[] = {"p", "div", ...};
   for (String tag : tags) {
     sheet.applyStyle( tag, styleMap );
   }
```
Ich bin mir nicht sicher, aber vielleicht sind Sie in der Lage, nur applyStyle("body", styleMap) habe und es stürzen in alles, was es enthält, aber ich bin mir nicht sicher. Ich bin mir auch nicht sicher, dass diese Adresse wäre für den 1-line-test, so gibt es keine tags beteiligt. Wenn ich mich Recht erinnere, bauen wir ein body-tag, wenn es nicht ein, aber ich bin mir überhaupt nicht sicher.

vielleicht haben Sie schon ein Beispiel dafür:1) iText 5.0.6 wurde heute veröffentlicht mit einer umfangreichen überarbeitung der HTML->PDF-Konvertierung-code. Ich schlage vor, Sie versuchen den neuen code statt.

InformationsquelleAutor Mark Storer

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

HTML & CSS-Lösung

Controller:

CSS:

Ansicht-layout

Anzeigen Seite

Innen-code-schriftart-ersetzen-Lösung

FontProvider (über FontFactory)

Controller

CSS:

Ansicht-layout

Anzeigen Seite

`FontProvider` (über `FontFactory`)