Zum analysieren von text in Sätze,

Ich bin versucht zu brechen, bis ein Absatz in Sätzen. Hier ist mein code bisher:

import java.util.*;

public class StringSplit {
 public static void main(String args[]) throws Exception{
     String testString = "The outcome of the negotiations is vital, because the current tax levels signed into law by President George W. Bush expire on Dec. 31. Unless Congress acts, tax rates on virtually all Americans who pay income taxes will rise on Jan. 1. That could affect economic growth and even holiday sales.";
     String[] sentences = testString.split("[\\.\\!\\?]");
     for (int i=0;i<sentences.length;i++){  
         System.out.println(i);
      System.out.println(sentences[i]);  
     }  
 }
}

Wurden zwei Probleme gefunden:

  1. Der code splittet jederzeit kommt es zu einer Periode (".") symbol, auch wenn es eigentlich ein Satz. Wie kann ich dies verhindern?
  2. Jedem Satz, die split beginnt mit einem Leerzeichen. Wie lösche ich die redundant Platz?
InformationsquelleAutor user533203 | 2010-12-07
Schreibe einen Kommentar