[Schmitzm-commits] r2079 - in trunk/schmitzm-adresses/src: main/java/de/schmitzm/adresses test/java/de/schmitzm/adresses
scm-commit at wald.intevation.org
scm-commit at wald.intevation.org
Mon Sep 3 21:47:18 CEST 2012
Author: alfonx
Date: 2012-09-03 21:47:17 +0200 (Mon, 03 Sep 2012)
New Revision: 2079
Modified:
trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java
trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java
Log:
Modified: trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java
===================================================================
--- trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java 2012-08-29 14:09:00 UTC (rev 2078)
+++ trunk/schmitzm-adresses/src/main/java/de/schmitzm/adresses/AddrStringUtil.java 2012-09-03 19:47:17 UTC (rev 2079)
@@ -68,8 +68,8 @@
hn = RegexCache.getInstance().replaceAll(hn, "\\s", "");
hn = RegexCache.getInstance().replaceAll(hn, "\\+", ",");
hn = RegexCache.getInstance().replaceAll(hn, Pattern.quote("\\\\"), Matcher.quoteReplacement("\\"));
-// hn = RegexCache.getInstance().replaceAll(hn, ",", "");
-// hn = RegexCache.getInstance().replaceAll(hn, "/", "");
+ // hn = RegexCache.getInstance().replaceAll(hn, ",", "");
+ // hn = RegexCache.getInstance().replaceAll(hn, "/", "");
hn = RegexCache.getInstance().replaceAll(hn, "bis", "-");
return hn;
@@ -516,16 +516,18 @@
ort = ort.toLowerCase();
// ein in kammern stehender zusatz " (main)" wird in "xmein.." umgewandelt
- ort = RegexCache.getInstance().replaceAll(ort, "\\((.*)\\)", "xx$1"); // neu
+ ort = RegexCache.getInstance().replaceAll(ort, "\\((.*)\\)", "xx$1");
ort = RegexCache.getInstance().replaceAll(ort, "(?i)freiburg.+(i\\.?.?b(\\.||reisgau))[^r]",
- "freiburg im breisgau"); // neu
+ "freiburg im breisgau");
ort = RegexCache.getInstance().replaceAll(ort, "(?i)^\\s*emmerich$", "emmerich am rhein");
ort = RegexCache.getInstance().replaceAll(ort, "\\brbge\\.?\\b", "ruebenberge");
ort = RegexCache.getInstance().replaceAll(ort, "\\bopf\\.?\\b", "oberpfalz");
ort = RegexCache.getInstance().replaceAll(ort, "\\bupf\\.?\\b", "unterpfalz");
+ ort = RegexCache.getInstance().replaceAll(ort, "\\bo\\.\\s?l\\.", "oberlausitz"); // 3.9.2012
+
ort = RegexCache
.getInstance()
.replaceAll(
@@ -550,31 +552,32 @@
ort = RegexCache.getInstance().replaceAll(ort, "^maria[-\\s].", "");
- ort = RegexCache.getInstance().replaceAll(ort, "\\bi(\\.?\\s|\\s)Sa(\\.|\\s)", "insachsen"); // neu
+ ort = RegexCache.getInstance().replaceAll(ort, "\\bi(\\.?\\s|\\s)Sa(\\.|\\s)", "insachsen");
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bauf\\b", "xx"); // NEU 10.5.2012 "Bergen auf Rügen"
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bauf\\b", "xx");
ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]der\\b", "xx");
- ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\ban[\\.\\s]d[\\.\\s]\\b", "xx");
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]der\\b", "xx"); // neuneu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]der\\b\\s+", "xx"); // 3.9.2012
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bin[\\.\\s]d[\\.\\s]\\b", "xx");
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]der\\b", "xx"); // neuneu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]d[\\.\\s]\\b", "xx"); // neuneu
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]der\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]+d[\\.\\s]+\\b", "xx"); // 3.9.2012
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bim\\b", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bam\\b", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\ban\\b", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bbei\\b", "xx"); // neu
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bin\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bim\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bam\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\ban\\b", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bbei\\b", "xx");
- // ort = RegexCache.getInstance().replaceAll(ort,".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx"); // Bad Neustadt a. d. Saale
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]\\s?d[\\.\\s]", "xx");
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]", "xx"); // neu
- ort = RegexCache.getInstance().replaceAll(ort, ".\\bb[\\.\\s]", "xx"); // neu
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bi[\\.\\s]", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\ba[\\.\\s]", "xx");
+ ort = RegexCache.getInstance().replaceAll(ort, ".\\bb[\\.\\s]", "xx");
+
+ ort = RegexCache.getInstance().replaceAll(ort, " oberlausitz$", "xxoberlausitz"); // 3.9.2012
ort = norm(ort);
Modified: trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java
===================================================================
--- trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java 2012-08-29 14:09:00 UTC (rev 2078)
+++ trunk/schmitzm-adresses/src/test/java/de/schmitzm/adresses/AddrStringUtilTest.java 2012-09-03 19:47:17 UTC (rev 2079)
@@ -212,29 +212,6 @@
}
@Test
- public void testNormalizeStrasse() {
- checkNormalizeStrasse("jaegerndorferzeile", "Jägerndorfer Zeile");
- checkNormalizeStrasse("weststrasse", "West Straße");
- checkNormalizeStrasse("weststrasse", "West Str.");
- checkNormalizeStrasse("hatschiergasse", " hatschiergasse ");
- checkNormalizeStrasse("eichendorfstrasse", "Eichendorfstr.");
- checkNormalizeStrasse("burgstrasse", "Burgstr.");
- checkNormalizeStrasse("burgstrasse", "Burg Straße");
- checkNormalizeStrasse("drosselweg", "Drossel Weg");
- checkNormalizeStrasse("drvogelerstrasse", "Dr.-Vogeler-Str.");
- checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Str.");
- checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Str .");
- checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Strasse");
- checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler Straße");
- checkNormalizeStrasse("drvogelerstrasse", "Dr. Vogeler-Straße");
- checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogeler-Straße");
- checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogelerstraße");
- checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogelerstrasse");
- checkNormalizeStrasse("drvogelerstrasse", "Dr.Vogeler S");
-
- }
-
- @Test
public void testNormalizeZusatz() {
checkNormalizeZusatz("palim palim", "Palim Palim");
checkNormalizeZusatz("dumdidum", " dumdidum ");
@@ -246,10 +223,6 @@
checkNormalizeZusatz("a", "á");
}
- private void checkNormalizeStrasse(String s1, String s2) {
- assertEquals(s1, AddrStringUtil.normalizeStrasse(s2).getResultStr());
- }
-
private void checkNormalizeZusatz(String s1, String s2) {
assertEquals(s1, AddrStringUtil.normalizeZusatz(s2).getResultStr());
}
@@ -297,16 +270,24 @@
assertEquals("marktscheuren", AddrStringUtil.normalizeOrt("Markt Scheuren"));
assertEquals("markt", AddrStringUtil.normalizeOrt("Markt"));
assertEquals("berbu", AddrStringUtil.normalizeOrt("Berbu Markt"));
-
+
assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a.d.Saale"));
assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a. d. Saale"));
assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a. d. Saale"));
assertEquals("badneustadtxxsaale", AddrStringUtil.normalizeOrt("Bad Neustadt a. Saale"));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser O.L."));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d. Oberlausitz"));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d. O.L."));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser i.d.O.L."));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser in der O.L."));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser in der Oberlausitz"));
+ assertEquals("weisswasserxxoberlausitz", AddrStringUtil.normalizeOrt("Weißwasser Oberlausitz"));
+
}
@Test
- public void testNormalizeStrasse2() {
+ public void testNormalizeStrasse() {
assertEquals("jaegerndorferzeile", AddrStringUtil.normalizeStr("Jägerndorfer Zeile"));
assertEquals("weststrasse", AddrStringUtil.normalizeStr("West Straße"));
assertEquals("weststrasse", AddrStringUtil.normalizeStr("West Str."));
@@ -344,14 +325,15 @@
}
@Test
- public void testVereinfacheHn() {
- assertEquals(1, AddrStringUtil.vereinfacheHn("001"),0);
- assertEquals(32, AddrStringUtil.vereinfacheHn("32-34"),0);
- assertEquals(34, AddrStringUtil.vereinfacheHn("34-32"),0);
- assertEquals(12, AddrStringUtil.vereinfacheHn("12/24"),0);
- assertEquals(12, AddrStringUtil.vereinfacheHn("12+13"),0);
- assertEquals(12, AddrStringUtil.vereinfacheHn("12 bis 24/1"),0);
- }
+ public void testVereinfacheHn() {
+ assertEquals(1, AddrStringUtil.vereinfacheHn("001"), 0);
+ assertEquals(32, AddrStringUtil.vereinfacheHn("32-34"), 0);
+ assertEquals(34, AddrStringUtil.vereinfacheHn("34-32"), 0);
+ assertEquals(12, AddrStringUtil.vereinfacheHn("12/24"), 0);
+ assertEquals(12, AddrStringUtil.vereinfacheHn("12+13"), 0);
+ assertEquals(12, AddrStringUtil.vereinfacheHn("12 bis 24/1"), 0);
+ }
+
@Test
public void testNormalizeHn() {
assertEquals("1", AddrStringUtil.normalizeHn(" 001"));
@@ -380,7 +362,7 @@
public void testSaeubereStrassenname() {
assertEquals("Taubenstr. 45", AddrStringUtil.saeubereStrassenname("Taubenstraße45"));
assertEquals("Taubenstr. 45", AddrStringUtil.saeubereStrassenname("Taubenstr.ße 45"));
-
+
assertEquals("", AddrStringUtil.saeubereStrassenname(""));
assertEquals("", AddrStringUtil.saeubereStrassenname(" "));
assertEquals("112233", AddrStringUtil.saeubereStrassenname(" 112233 "));
More information about the Schmitzm-commits
mailing list