[Schmitzm-commits] r2304 - trunk/schmitzm-regex/src/main/java/de/schmitzm/regex

scm-commit at wald.intevation.org scm-commit at wald.intevation.org
Sun Apr 28 02:01:00 CEST 2013


Author: alfonx
Date: 2013-04-28 02:01:00 +0200 (Sun, 28 Apr 2013)
New Revision: 2304

Modified:
   trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexCache.java
   trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexUtil.java
Log:


Modified: trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexCache.java
===================================================================
--- trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexCache.java	2013-04-27 23:36:41 UTC (rev 2303)
+++ trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexCache.java	2013-04-28 00:01:00 UTC (rev 2304)
@@ -48,7 +48,7 @@
 	 */
 	private static final int CACHE_VALUES_TO_RESULT_MAX_REGEX_LENGTH = 10000;
 
-	private static RegexCache singletonInstance;
+	private static volatile RegexCache singletonInstance;
 
 	private final ConcurrentLRUCache<String, Pattern> patternCache = new ConcurrentLRUCache<String, Pattern>(110000,
 			90000);

Modified: trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexUtil.java
===================================================================
--- trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexUtil.java	2013-04-27 23:36:41 UTC (rev 2303)
+++ trunk/schmitzm-regex/src/main/java/de/schmitzm/regex/RegexUtil.java	2013-04-28 00:01:00 UTC (rev 2304)
@@ -8,8 +8,8 @@
 
 	/**
 	 * Kann verwendet werden, um einen String von XML/HTML Tags zu säubern. Rückgabe ist ein ein String ohne Tags. Mehr
-	 * als 2 Leerzeichen werden zu einem Leerzeichen. Am Ende und Anfang nie Leerzeichen. Ein <li>wird zu einem * um die
-	 * Lesbarkeit als Rein-Text zu verbessern.<br/>
+	 * als 2 Leerzeichen werden zu einem Leerzeichen. Am Ende und Anfang nie Leerzeichen. // * Ein <li>wird zu einem *
+	 * um die // * Lesbarkeit als Rein-Text zu verbessern.<br/>
 	 * Die Methode basiert auf RegEx. Es wird also kein valides oder wellformed-XML erwartet.
 	 */
 	public static String removeTags(String withTags) {
@@ -18,19 +18,21 @@
 
 		String withoutTags = withTags;
 
-		Matcher matcher = RegexCache.getInstance().getMatcher("<li>", withoutTags);
-		if (matcher.find())
-			withoutTags = matcher.replaceAll("*");
+		RegexCache rC = RegexCache.getInstance();
+		// Matcher matcher = rC.getMatcher("<li>", withoutTags);
+		// if (matcher.find())
+		// withoutTags = matcher.replaceAll("*");
 
-		matcher = RegexCache.getInstance().getMatcher(REMOVETAGSREGEX, withoutTags);
+		Matcher matcher = rC.getMatcher(REMOVETAGSREGEX, withoutTags);
 		if (matcher.find())
 			withoutTags = matcher.replaceAll(" ");
 
-		matcher = RegexCache.getInstance().getMatcher("\\b\\+\\b", withoutTags);
-		if (matcher.find())
-			withoutTags = matcher.replaceAll(" ");
+		// Das macht Strassenangaben kaputt, die zwei hausnummern haben "Weg 3+4"
+		// matcher = rC.getMatcher("\\b\\+\\b", withoutTags);
+		// if (matcher.find())
+		// withoutTags = matcher.replaceAll(" ");
 
-		matcher = RegexCache.getInstance().getMatcher("\\s{1,}", withoutTags);
+		matcher = rC.getMatcher("\\s{1,}", withoutTags);
 		if (matcher.find())
 			withoutTags = matcher.replaceAll(" ");
 



More information about the Schmitzm-commits mailing list