diff --git a/src/JobsMedical.Web/Services/Scraping/FacilityMatcher.cs b/src/JobsMedical.Web/Services/Scraping/FacilityMatcher.cs index 4eca8cd..30b6ea0 100644 --- a/src/JobsMedical.Web/Services/Scraping/FacilityMatcher.cs +++ b/src/JobsMedical.Web/Services/Scraping/FacilityMatcher.cs @@ -18,6 +18,9 @@ public static class FacilityMatcher "بیمارستان", "زایشگاه", "پلی کلینیک", "پلیکلینیک", "درمانگاه", "کلینیک", "مرکز درمانی", "مرکز جراحی", "مجتمع پزشکی", "مجتمع درمانی", "مرکز", "مجتمع", "آزمایشگاه", "داروخانه", "آسایشگاه", "مطب", "تخصصی", "فوق تخصصی", "فوقتخصصی", "عمومی", "دکتر", "دی کلینیک", + // Generic descriptors — never the distinctive part of a name. Stripping them stops false + // merges like «درمانگاه شبانه‌روزی اسفند» → «پلی کلینیک شبانه روزی» (they share «شبانه روزی»). + "شبانه روزی", "شبانه‌روزی", "خیریه", "دولتی", "خصوصی", "۲۴ ساعته", "24 ساعته", "تامین اجتماعی", }; /// Lower-cased, Arabic→Persian folded, punctuation-stripped, whitespace-collapsed.