Få bedre innsikt for å optimalisere dataressurser

Spectrum Data Discovery Module

Få innsikten du trenger før du setter i gang med prosjekter for dataintegrering, datakvalitet, datastyring eller administrering av hoveddata. Dataoppdagelse er prosessen med å skanne dataressurser for å få en fullstendig oversikt over datalandskapet.

Programvare for dataoppdagelse

Spectrum™ Data Discovery Module kan skanne strukturerte data, ustrukturerte data og semistrukturerte data ved hjelp av en rekke teknikker for dataprofilering. Resultatet av skanningen brukes til automatisk generering av et bibliotek med dokumentasjon som beskriver selskapets dataressurser, og til å opprette et repositorium for metadata.



Denne dokumentasjonen og de tilhørende metadataene gir deg innsikten du trenger før du setter i gang med prosjekter for dataintegrering, datakvalitet, datastyring eller administrering av hoveddata.

Vårt dataoppdagelseslag gir selskaper et stort utvalg funksjoner for å skanne og sette opp en oversikt over datalandskapet. Med disse programmene kan virksomheter utføre følgende:

  • Skanne datamiljøet (strukturerte data, ustrukturerte data, semistrukturerte data)
  • Opprette og fylle ut et søkbart repositorium for metadata, for bedriftsbrukere og tekniske brukere

Vårt profileringslag utstyrer deg med muligheter for omfattende dataprofilering som er lett å forstå, bruke og vedlikeholde, mens du kjører oppgavene du ønsker.

Hovedfunksjoner for vår programvare for dataoppdagelse

Spectrum™ Data Discovery Module tilbyr en rekke utmerkede funksjoner som kan hjelpe deg med å få bedre innsikt og optimalisere dataressursene dine.

Skann og lag en oversikt over datalandskapet


Bruk funksjonene for dataoppdagelse til å utføre følgende oppgaver:

  • Skanne ditt strukturerte, ustrukturerte eller semistrukturerte datamiljø
  • Opprette og fylle ut et søkbart repositorium for metadata, for bedriftsbrukere og tekniske brukere
  • Koble til ulikt strukturerte databaser gjennom hele datalandskapet på en sikker måte
  • Automatisere oppdagelse av metadata i relasjonelle databaser og opprette en fullstendig katalog over virksomhetens metadata som er nødvendige for integrering av virksomhetsdata
  • Skanne domener i kodefiler og identifisere navn på tabeller og kolonner i valgte skjemaer som er brukt i innholdet til skannede kodefiler
  • Skanne oppdagelses- og kataloginformasjon som finnes i en rekke filtyper, blant andre Microsoft Access database med fast lengde, kommadelte filer, Excel, PDF-dokument, PPT, ren tekst, RTF og XSD

Våre profileringsfunksjoner gjør følgende oppgaver enkle å forstå, bruke og vedlikeholde:

  • Oppdage og katalogisere udokumenterte metadata i tilknytning til ditt globale datalandskap og bygge et integrert metadatarepositorium for virksomheten
  • Identifisere dokumenterte og udokumenterte ID-kolonner og kolonner med naturlig nøkkel, sammensatte nøkler og ID-er i flere kolonner
  • Identifisere dokumenterte utledede og brukerdefinerte relasjoner
  • Identifisere og profilere undertyper i en tabell i et av virksomhetens datalandskaper
  • Analysere data i kommadelte filer, få forslag til feilverdier og katalogisere dem
  • Profilere data som er lagret i filer, uten å laste dem inn i en database med støtte for følgende filtyper: flat fil (.txt), EBCDIC-fil (.txt,) SAS-datafil (.sas7bdat), kommadelt (.csv og .txt), symboldelt (.txt), tabulatordelt (.tsv & .tab) og XML
  • Analysere data i Access Excel (.xls og .xlsx)- og XML-filer, få forslag til feilverdier og katalogisere dem
  • Analysere data og få forslag til utenforliggende verdier basert på tidsrommet for forekomsten