Frequently Asked Question
Pobierając dane z CEIDG mam dużo duplikatów. Z czego to wynika?
Last Updated 9 years ago
Duplikaty pojawiaja sie w przypadku kiedy pobieramy wiele branz PKD i pobrane firmy zgłosily działalność dla wielu branż PKD. Jeżeli firma F zgłosila, że prowadzi dzialalność dla branży A i B wtedy Crawler wysyla dwa zapytania do CEIDG.
- Pierwsze zapytanie. Wyszukaj wszystkie firmy prowadzące dzialałność w branży A. CEIDG zwraca firmę F ponieważ prowadzi ona działalność w branzy A.
- Drugie zapytanie. Wyszukaj wszystkie firmy prowadzące działalność w branży B. CEIDG zwraca również firmę F ponieważ prowadzi ona działalność w branzy B.
Stąd wynikaja duplikaty. Crawler sam w sobie nie interpretuje, nie usuwa duplikatów ani nie filtruje wyników zwracach przez CEIDG. Dane są zapisywane w takich postaci w jakiej zwraca je CEIDG.
Gdyby Crawler dla drugiego zapytania usunał te firme z pliku Excela to byłoby to wprowadzenie użytkownika w błąd bo to oznaczaloby, że firma prowadzi działalność dla branży A i nie prowadzi dla branży B.
Gdyby Crawler dla drugiego zapytania usunał te firme z pliku Excela to byłoby to wprowadzenie użytkownika w błąd bo to oznaczaloby, że firma prowadzi działalność dla branży A i nie prowadzi dla branży B.