[Schmitzm-commits] r2079 - in trunk/schmitzm-adresses/src: main/java/de/schmitzm/adresses test/java/de/schmitzm/adresses

scm-commit at wald.intevation.org scm-commit at wald.intevation.org
Mon Sep 3 21:47:18 CEST 2012


Author: alfonx
Date: 2012-09-03 21:47:17 +0200 (Mon, 03 Sep 2012)
New Revision: 2079

Modified:
   trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java
   trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java
Log:


Modified: trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java
===================================================================
--- trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java	2012-08-29 14:09:00 UTC (rev 2078)
+++ trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java	2012-09-03 19:47:17 UTC (rev 2079)
@@ -68,8 +68,8 @@
 		hn = RegexCache.getInstance().replaceAll(hn, "\\s", "");
 		hn = RegexCache.getInstance().replaceAll(hn, "\\+", ",");
 		hn = RegexCache.getInstance().replaceAll(hn, Pattern.quote("\\\\"), Matcher.quoteReplacement("\\"));
-//		hn = RegexCache.getInstance().replaceAll(hn, ",", "");
-//		hn = RegexCache.getInstance().replaceAll(hn, "/", "");
+		// hn = RegexCache.getInstance().replaceAll(hn, ",", "");
+		// hn = RegexCache.getInstance().replaceAll(hn, "/", "");
 		hn = RegexCache.getInstance().replaceAll(hn, "bis", "-");
 
 		return hn;
@@ -516,16 +516,18 @@
 		ort = ort.toLowerCase();
 
 		// ein in kammern stehender zusatz " (main)" wird in "xmein.." umgewandelt
-		ort = RegexCache.getInstance().replaceAll(ort, "\\((.*)\\)", "xx$1"); // neu
+		ort = RegexCache.getInstance().replaceAll(ort, "\\((.*)\\)", "xx$1");
 
 		ort = RegexCache.getInstance().replaceAll(ort, "(?i)freiburg.+(i\\.?.?b(\\.||reisgau))[^r]",
-				"freiburg im breisgau"); // neu
+				"freiburg im breisgau");
 		ort = RegexCache.getInstance().replaceAll(ort, "(?i)^\\s*emmerich$", "emmerich am rhein");
 
 		ort = RegexCache.getInstance().replaceAll(ort, "\\brbge\\.?\\b", "ruebenberge");
 		ort = RegexCache.getInstance().replaceAll(ort, "\\bopf\\.?\\b", "oberpfalz");
 		ort = RegexCache.getInstance().replaceAll(ort, "\\bupf\\.?\\b", "unterpfalz");
 
+		ort = RegexCache.getInstance().replaceAll(ort, "\\bo\\.\\s?l\\.", "oberlausitz"); // 3.9.2012
+
 		ort = RegexCache
 				.getInstance()
 				.replaceAll(
@@ -550,31 +552,32 @@
 
 		ort = RegexCache.getInstance().replaceAll(ort, "^maria[-\\s].", "");
 
-		ort = RegexCache.getInstance().replaceAll(ort, "\\bi(\\.?\\s|\\s)Sa(\\.|\\s)", "insachsen"); // neu
+		ort = RegexCache.getInstance().replaceAll(ort, "\\bi(\\.?\\s|\\s)Sa(\\.|\\s)", "insachsen");
 
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bauf\\b", "xx"); // NEU 10.5.2012 "Bergen auf Rügen"
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bauf\\b", "xx");
 		ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]der\\b", "xx");
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]d[\\.\\s]\\b", "xx");
 
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]der\\b", "xx"); // neuneu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]der\\b\\s+", "xx"); // 3.9.2012
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]d[\\.\\s]\\b", "xx");
 
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]der\\b", "xx"); // neuneu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]der\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]+d[\\.\\s]+\\b", "xx"); // 3.9.2012
 
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bim\\b", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bam\\b", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\ban\\b", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bbei\\b", "xx"); // neu
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bim\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bam\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\ban\\b", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bbei\\b", "xx");
 
-		// ort = RegexCache.getInstance().replaceAll(ort,".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx"); // Bad Neustadt a. d. Saale
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx");
 
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]", "xx"); // neu
-		ort = RegexCache.getInstance().replaceAll(ort, ".\\bb[\\.\\s]", "xx"); // neu
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]", "xx");
+		ort = RegexCache.getInstance().replaceAll(ort, ".\\bb[\\.\\s]", "xx");
+		
+		ort = RegexCache.getInstance().replaceAll(ort, " oberlausitz$", "xxoberlausitz"); // 3.9.2012
 
 		ort = norm(ort);
 

Modified: trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java
===================================================================
--- trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java	2012-08-29 14:09:00 UTC (rev 2078)
+++ trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java	2012-09-03 19:47:17 UTC (rev 2079)
@@ -212,29 +212,6 @@
 	}
 
 	@Test
-	public void testNormalizeStrasse() {
-		checkNormalizeStrasse("jaegerndorferzeile", "Jägerndorfer Zeile");
-		checkNormalizeStrasse("weststrasse", "West  Straße");
-		checkNormalizeStrasse("weststrasse", "West  Str.");
-		checkNormalizeStrasse("hatschiergasse", " hatschiergasse ");
-		checkNormalizeStrasse("eichendorfstrasse", "Eichendorfstr.");
-		checkNormalizeStrasse("burgstrasse", "Burgstr.");
-		checkNormalizeStrasse("burgstrasse", "Burg Straße");
-		checkNormalizeStrasse("drosselweg", "Drossel Weg");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr.-Vogeler-Str.");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Str.");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Str .");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Strasse");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Straße");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler-Straße");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogeler-Straße");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogelerstraße");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogelerstrasse");
-		checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogeler S");
-
-	}
-
-	@Test
 	public void testNormalizeZusatz() {
 		checkNormalizeZusatz("palim palim", "Palim  Palim");
 		checkNormalizeZusatz("dumdidum", "  dumdidum  ");
@@ -246,10 +223,6 @@
 		checkNormalizeZusatz("a", "á");
 	}
 
-	private void checkNormalizeStrasse(String s1, String s2) {
-		assertEquals(s1, AddrStringUtil.normalizeStrasse(s2).getResultStr());
-	}
-
 	private void checkNormalizeZusatz(String s1, String s2) {
 		assertEquals(s1, AddrStringUtil.normalizeZusatz(s2).getResultStr());
 	}
@@ -297,16 +270,24 @@
 		assertEquals("marktscheuren", AddrStringUtil.normalizeOrt("Markt Scheuren"));
 		assertEquals("markt", AddrStringUtil.normalizeOrt("Markt"));
 		assertEquals("berbu", AddrStringUtil.normalizeOrt("Berbu Markt"));
-		
+
 		assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a.d.Saale"));
 		assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a. d. Saale"));
 		assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a.  d.  Saale"));
 		assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a.  Saale"));
 
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser O.L."));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d. Oberlausitz"));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d. O.L."));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d.O.L."));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser in der O.L."));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser in der Oberlausitz"));
+		assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser Oberlausitz"));
+
 	}
 
 	@Test
-	public void testNormalizeStrasse2() {
+	public void testNormalizeStrasse() {
 		assertEquals("jaegerndorferzeile", AddrStringUtil.normalizeStr("Jägerndorfer Zeile"));
 		assertEquals("weststrasse", AddrStringUtil.normalizeStr("West  Straße"));
 		assertEquals("weststrasse", AddrStringUtil.normalizeStr("West  Str."));
@@ -344,14 +325,15 @@
 	}
 
 	@Test
-		public void testVereinfacheHn() {
-			assertEquals(1, AddrStringUtil.vereinfacheHn("001"),0);
-			assertEquals(32, AddrStringUtil.vereinfacheHn("32-34"),0);
-			assertEquals(34, AddrStringUtil.vereinfacheHn("34-32"),0);
-			assertEquals(12, AddrStringUtil.vereinfacheHn("12/24"),0);
-			assertEquals(12, AddrStringUtil.vereinfacheHn("12+13"),0);
-			assertEquals(12, AddrStringUtil.vereinfacheHn("12 bis 24/1"),0);
-		}
+	public void testVereinfacheHn() {
+		assertEquals(1, AddrStringUtil.vereinfacheHn("001"), 0);
+		assertEquals(32, AddrStringUtil.vereinfacheHn("32-34"), 0);
+		assertEquals(34, AddrStringUtil.vereinfacheHn("34-32"), 0);
+		assertEquals(12, AddrStringUtil.vereinfacheHn("12/24"), 0);
+		assertEquals(12, AddrStringUtil.vereinfacheHn("12+13"), 0);
+		assertEquals(12, AddrStringUtil.vereinfacheHn("12 bis 24/1"), 0);
+	}
+
 	@Test
 	public void testNormalizeHn() {
 		assertEquals("1", AddrStringUtil.normalizeHn(" 001"));
@@ -380,7 +362,7 @@
 	public void testSaeubereStrassenname() {
 		assertEquals("Taubenstr. 45", AddrStringUtil.saeubereStrassenname("Taubenstraße45"));
 		assertEquals("Taubenstr. 45", AddrStringUtil.saeubereStrassenname("Taubenstr.ße 45"));
-		
+
 		assertEquals("", AddrStringUtil.saeubereStrassenname(""));
 		assertEquals("", AddrStringUtil.saeubereStrassenname("     "));
 		assertEquals("112233", AddrStringUtil.saeubereStrassenname(" 112233    "));



More information about the Schmitzm-commits mailing list