IPS on Infootsingusüsteemide eesmärk ja funktsioonid

Sisukord:

IPS on Infootsingusüsteemide eesmärk ja funktsioonid
IPS on Infootsingusüsteemide eesmärk ja funktsioonid

Video: IPS on Infootsingusüsteemide eesmärk ja funktsioonid

Video: IPS on Infootsingusüsteemide eesmärk ja funktsioonid
Video: Купил все Мороженое из КРАСНОЕ & БЕЛОЕ. Эскимо за Копейки. Стоит ли покупать? 2024, Aprill
Anonim

Kaasaegsel inimesel on raske ette kujutada elu ilma Internetita ja peaaegu hetkelise juurdepääsuta teabeallikatele. Kasutaja mõtleb harva sellele, kuidas võrgust soovitud sisu otsitakse. Aga see on väga huvitav.

Infootsingusüsteem (IPS) on keerukas tarkvara- ja riistvarasüsteem, mis valib teavet kasutaja soovil. Infot hoitakse serverites digitaalsel kujul, nagu varem olid raamatukogude riiulitel raamatud. Süsteem koosneb paljudest alamsüsteemidest. Igaüks täidab oma ülesannet kasutaja päringu töötlemise ja talle teksti- või helivormingus teabe edastamise protsessis. Lahendatavate ülesannete paljusus määrab tänapäevaste infootsingusüsteemide (lühend teabeotsingusüsteemist) arhitektuuri keerukuse. Omamoodi "must kast": sisendis - päringu tekst, sees olev - pole teada, väljundis - põhjalik teave.

Kaardifail päriselus
Kaardifail päriselus

Sisendvood

Soovib teavet, mille inimene vormistab oma vidina ekraanil teksti kujul,moodustavad väikese osa otsingumootori poolt töödeldud päringutest. Otsingupäringute põhimassiivid moodustavad robotid, mis võtavad vastu inimese päringu ning sooritavad mitmeastmelise otsingu ja kasutajaga tagasisidet. Teabeotsingusüsteemide hulka kuuluvad tuntud Google, Yandex ja teised, mis töötlevad iga päev miljoneid päringuid.

Allikaotsingu objektid

Otsingu jaoks huvipakkuvate esialgsete objektide komplekt on dokumendid, kirjed, videod, pildid ja palju muud. Need luuakse väljaspool IPS-i. Üldises teabesalvestus- ja otsingusüsteemis peaks olema sisseehitatud bibliograafiline süsteem – omamoodi kataloog, mis võimaldab otsida mis tahes objekte.

Objektid või nende digitaalsed teisendused muutuvad IPS-i "sisenemisressursiks". Just nende hulgast valitakse välja teave, mida kasutaja vajab.

Otsige teavet
Otsige teavet

Välised allikad

Teabevaliku vaade kasutab väliseid teadmisteallikaid. See on teave, mida kasutaja otsib. Filmi pealkiri, tsitaat raamatust ja palju muud. Arvutiotsingu jaoks tuleb see teave tõlkida päringusse algoritmilises keeles. IPS-is tehakse seda päringute loomise, indekseerimise ja arendamise plokki kasutades.

Ideaaljuhul peaksid need kolm protsessi – esitus, indekseerimine ja päringu arendamine – tuginema identsetele teadmiste allikatele, kuid praktikas pole see saavutatav.

Teadmiste allikaid tuleks pidev alt üle vaadata ja ajakohastada ning värskendus peaks olema identne jasünkroniseeritud. Ja väline teadmiste allikas eelneb alati kronoloogiliselt selle kasutamisele otsingumootorites päringu tegemiseks, mõnikord mitu aastat.

Infootsingu süsteem
Infootsingu süsteem

Esinemised

Algsete objektide esitused koosnevad sisendandmetest mingis kombinatsioonis või teisendatakse vastav alt konkreetse teabeotsingusüsteemi reeglitele ja algoritmidele.

Vaated on algse otsinguobjekti enam-vähem teisendatud koopiad. Toimetamata täistekstide kogus on iga tekst oma esitus. Muuseumieksponaatide ja esemete kogus võib esitus olla objekti teisendatud kirjeldus koos selle kujutisega. Mõnel juhul võib esitus tuleneda osaliselt algsest objektist ja osaliselt kirjeldusest: bibliograafilistes otsingumootorites tuletatakse esitused objektist - näiteks pealkiri, autori nimi liidetakse teose annotatsiooniga.

Vajaliku leidmine
Vajaliku leidmine

Otsitav register

Kuna infootsingusüsteemides salvestatakse infot esituse kujul, siis on loogiline eeldada, et otsing tehakse esituse järgi ja pärast valimist antakse kasutajale. Praktikas see nii ei ole. Näiteks praegused veebiteegi kataloogid piiravad tavaliselt otsinguid mõne väljaga: autor, pealkiri ja subtiitrid vaates, mis sisaldab muid välju, mida ei otsita. See on piisav põhjus, miks on vaja eristadavaade ja otsitav register, mis on vaate otsingu osa. See määratleb kõik, mis peaks olema otsitav. Otsitava registri, nagu vaate- ja lähteobjekti, saab jagada eraldi alamindeksiteks, et pakkuda täpsemaid ja sihitud otsinguid

Otsingumootoritel on kehtivate otsingutulemuste sobitamiseks tavaliselt sisemine sünteetiline struktuur. See struktuur on otsitava indeksi teine komponent.

Protseduuriliselt saab indekseerimisprotsessi rakendada erineval viisil: otsitava indeksi saate:

  • otsitava esituse kopeerimine sõna otseses mõttes;
  • vaate üksikasjade kopeerimisega. See võib olla osa või kõik vaated, mis eksisteerivad füüsiliselt ainult fragmentidena, jaotatud vastav alt otsingu indeksi loomise reeglitele, mis vajaduse korral kogutakse.
Otsingu haldamine
Otsingu haldamine

Taotlemise reeglid ja ametlikud taotlused

Päringu kujundamine on funktsioon, mis vahendab kasutajapäringu ja ametliku päringu vahel. See muudab kasutaja päringu, sobitades selle enne otsimist otsingukäskude sõnaraamatute, indeksi spetsifikatsiooni ja indeksiga. IPS-i arendamise koidikul määrati see roll traditsiooniliselt kvalifitseeritud IT-spetsialistidele.

Arvutipäringute arendamist, mis suudavad sõnastikupäringuid sobitada otsitavasse registrisüsteemi, nimetatakse tavaliselt "sõnastiku sisendi" mooduliks. Selle funktsiooni automatiseerimine on paljulubav ja pakub võimalusi asjatundlikeks ja tõenäosuslikeks otsingumeetoditeks.

Ametlik päring muutub ametlikuks päringuks pärast kasutaja päringu teisendamist. Sellised formaalsed teisendused hõlmavad näiteks kärpimist, asendamist, normaliseerimist, vektoriseerimist ja muid "välise" esituse teisendusi arvuti IPS-i "siseteks" esitusteks (dekrüpteerimine – teabeotsingusüsteem).

Ekstraktitud dokumendilinkide komplektid

Saadud teabeallikate komplekt on loogiliselt vaadete alamhulk, mis on loodud otsitava indeksi ametlikule päringule rakendatud sobitusreeglite abil.

Tavaliselt, kuid mitte tingimata, on taastatud teabekogumi jaoks eraldi sortimisprotsess. Veebiraamatukogude kataloogid järjestavad vastuvõetud komplektid enne kuvamist tavaliselt autori järgi tähestikulises järjekorras. Teabeotsingusüsteemides, mis loovad ranged pingeread, eelneb järjestus järjestusele.

Andmete analüüs
Andmete analüüs

Väljundvood

Otsingutulemuste väljastamine toimub traditsiooniliselt ekraanil, sagedamini mujal või muul otstarbel kasutatavate objektide voona, mis lõpetab peamise otsingutsükli. Selliseid vooge saab saata visualiseerimisseadmetesse, salvestada edasiseks töötlemiseks või kasutada sisendvoogudena muudes valikuteenustes.

Teabeotsingusüsteemid võimaldavad tagasisidetmis tahes valikuprotsessi väljund. Iga protsessi väljund võib olla tagasiside teistele protsessidele. Tagasiside võib olla eksperthinnangu aluseks igal etapil.

Soovitan: