InformàticaProgramari

Cerca avançada i llenguatge de consulta. Llenguatge del motor de cerca

El llenguatge de consulta és un llenguatge de programació creat artificialment per fer consultes en bases de dades i sistemes d'informació.

En general, aquests mètodes de consulta es poden classificar depenent de si serveixen per a una base de dades o per a la recuperació d'informació. La diferència és que les sol·licituds a aquests serveis es fan per obtenir respostes reals a les preguntes plantejades, mentre que el cercador intenta trobar documents que continguin informació relacionada amb la regió d'interès per a l'usuari.

Bases de dades

Els idiomes de consulta per a bases de dades inclouen els següents exemples:

  • QL: orientat a objectes, es refereix a bases de dades relacionals; Successor de Datalog.
  • Contextual (CQL) és un llenguatge de representació de consulta formal per als sistemes de recuperació d'informació (com ara índexs web o directoris bibliogràfics).
  • CQLF (CODYASYL) - per a bases de dades CODASYL-TYPE.
  • El llenguatge de consulta orientat a conceptes (COQL) s'utilitza en els respectius models (com). Es basa en els principis de la construcció de models de dades i utilitza operacions com la projecció i la desconnexió de l'anàlisi multidimensional, les operacions analítiques i les conclusions.
  • DMX: utilitzat per als models de mineria de dades.
  • Datalog és l'idioma de les consultes a bases de dades deductives.
  • L'anglès Gellish és un llenguatge que es pot utilitzar per a consultes en bases de dades Gellish English i us permet fer diàlegs (consultes i respostes), i també serveix per a la modelització de la informació del coneixement.
  • HTSQL: tradueix les sol · licituds http a SQL.
  • ISBL - utilitzat per PRTV (un dels primers sistemes de gestió de bases de dades relacionals ).
  • LDAP és un protocol de consultes i serveis de directori que utilitza TCP / IP.
  • Es requereix MDX per a bases de dades OLAP.

Motors de cerca

El llenguatge de les consultes de recerca, al seu torn, té com a objectiu buscar dades als cercadors. Es diferencia perquè sovint les consultes contenen text sense format o hipertext amb sintaxi addicional (per exemple, "i" / "o"). Difereix significativament de llenguatges similars estàndard, que estan regulats per estrictes regles de sintaxi d'ordres o contenen paràmetres de posició.

Com es classifiquen les consultes de cerca?

Hi ha tres categories àmplies que abasten la majoria de consultes de cerca: informació, navegació i transaccional. Encara que aquesta classificació no es va solucionar de manera teòrica, es va confirmar empíricament la presència de consultes reals als cercadors.

Les sol · licituds d'informació són aquelles que abasten temes generals (per exemple, un model concret de ciutat o camió), per a això es poden obtenir milers de resultats rellevants.

Navegació: són consultes que cerquen un lloc o una pàgina web sobre un tema específic (per exemple, YouTube).

Transaccionals: reflecteixen la intenció de l'usuari d'executar una determinada acció, per exemple, fer una compra d'un automòbil o reservar un bitllet.

Els motors de cerca sovint admeten el quart tipus de consulta, que s'utilitza amb menys freqüència. Aquestes són les anomenades sol·licituds de connexió que contenen un informe sobre la connectivitat dels gràfics web indexats (el nombre d'enllaços a una URL específica o quantes pàgines estan indexades d'un domini específic).

Com es busca la informació?

La majoria dels recursos de cerca no revelen els registres de cerca, de manera que la informació sobre el que els usuaris busquen a la Web és molt difícil de trobar. No obstant això, la primera investigació científica va aparèixer el 1998. Posteriorment, es va realitzar una enquesta de seguiment l'any 2001, que va analitzar consultes que es van mostrar altament rellevants. També es va fer evident com el cercador utilitza el llenguatge de consulta.

Algunes característiques interessants relacionades amb la recerca web es van donar a conèixer:

La durada mitjana de la consulta de cerca era de 2.4 paraules.

  • Prop de la meitat dels usuaris van enviar una sol · licitud, i una mica menys d'un terç dels usuaris van fer tres o més consultes úniques una per una.
  • Gairebé la meitat dels usuaris només van veure la primera o dues pàgines dels resultats.
  • Menys del 5% dels usuaris utilitzen funcions de cerca avançada (per exemple, l'elecció de determinades categories o la cerca a la cerca).

Característiques de les accions personalitzades

L'estudi també va mostrar que el 19% de les consultes contenien un terme geogràfic (per exemple, noms, codis postals, objectes geogràfics, etc.). També val la pena observar que, a més de consultes breus (és a dir, amb diverses condicions), sovint hi ha sistemes previsibles, segons els quals els usuaris han canviat les seves frases de cerca.

També es va trobar que el 33% de les sol·licituds d'un usuari es repeteixen, i en el 87% dels casos l'usuari farà clic al mateix resultat. Això suggereix que molts usuaris utilitzen peticions repetides per revisar o tornar a trobar la informació.

Distribucions de consultes de freqüència

A més, els especialistes van confirmar que les distribucions de freqüències de consultes corresponen a la llei de potència. És a dir, una petita part de les paraules clau s'observa a la llista més gran de sol·licituds (per exemple, més de 100 milions), i s'utilitzen amb més freqüència. La resta de frases en els mateixos temes s'utilitzen amb menys freqüència i més individualment. Aquest fenomen es va anomenar el principi Pareto (o "regla 80-20"), i va permetre que els motors de cerca utilitzessin mètodes d'optimització com indexació de bases de dades o particions, emmagatzematge en memòria cau i descàrrega proactiva i també milloressin l'idioma de les consultes del motor de cerca.

En els últims anys, s'ha revelat que la longitud mitjana de la consulta augmenta constantment amb el temps. Així, la consulta mitjana en anglès es va fer més llarga. En aquest sentit, Google va presentar una actualització anomenada "Hummingbird" (agost de 2013), que és capaç de processar llargues frases de cerca amb un llenguatge de consulta "no parlada" (com "on es troba la cafeteria més propera?").

Per a consultes més llargues, el seu processament s'utilitza: es divideixen en frases, formulades en l'idioma estàndard, i les respostes a les diferents parts es mostren per separat.

Consultes estructurades

Els motors de cerca que admeten operacions lògiques i la sintaxi utilitzen idiomes de consulta més avançats. Un usuari que busca documents que cobreix diversos temes o cares pot descriure cadascun d'ells per la caracterització lògica de la paraula. En el seu nucli, el llenguatge de consulta lògica és un recull de frases específiques i signes de puntuació.

Què és la cerca avançada?

L'idioma de consulta de "Yandex" i "Google" és capaç de dur a terme una cerca més específica, subjecte a certes condicions. La cerca avançada pot cercar part del nom de la pàgina o el prefix del encapçalament, així com en determinades categories i llistes de noms. També pot restringir la cerca de pàgines que continguin paraules específiques del títol o que estiguin en determinats grups temàtics. Amb l'ús correcte de l'idioma de la consulta, es poden processar paràmetres d'un ordre de magnitud més complex que els resultats de la superfície de la majoria dels motors de cerca, inclosos els que l'usuari dóna amb paraules amb finalització variable i una ortografia similar. Quan mostreu els resultats d'una cerca avançada, es mostrarà un enllaç a les seccions rellevants de la pàgina.

També és possible cercar totes les pàgines que contenen una certa frase, mentre que amb una consulta estàndard, els motors de cerca no poden parar en cap pàgina del debat. En molts casos, el llenguatge de consulta pot portar a qualsevol pàgina situada a les etiquetes noindex.

En alguns casos, una consulta ben formada us permet trobar informació que conté diversos caràcters especials i lletres d'altres alfabets ( caràcters xinesos , per exemple).

Com es llegeixen els caràcters del llenguatge de consulta?

Les majúscules i minúscules, així com algunes marques diacríticas (umlauts i accents) no s'inclouen a la cerca. Per exemple, una cerca de la paraula clau Citroen no troba pàgines que continguin la paraula "Citroen". Però algunes lligadures corresponen a lletres individuals. Per exemple, una cerca de la paraula "aeroscòp" fàcilment trobarà pàgines que continguin "Ereskebing" (AE = Æ).

Molts caràcters no alfanumèrics són ignorats constantment. Per exemple, és impossible trobar informació sobre una consulta que conté la cadena | L | (La lletra entre dues barres verticals), tot i que aquest símbol s'utilitza en algunes plantilles de conversió. Els resultats només seran dades de LT. Alguns símbols i frases es tracten de diferents maneres: la consulta "crèdit (Finances) mostra articles amb les paraules" crèdit "i" finançament ", ignorant els claudàtors, fins i tot si hi ha un article amb el nom exacte" crèdit (Finances) ".

Hi ha moltes funcions que podeu utilitzar amb l'idioma de la consulta.

Sintaxi

L'idioma de consulta de "Yandex" i "Google" pot utilitzar algunes marques de puntuació per perfeccionar la cerca. Per exemple, els claudàtors {{recerca}}. La frase inclosa en ells serà cercada íntegrament, sense canvis.

La frase en cometes dobles permet determinar l'objecte de la cerca. Per exemple, es reconeix que una paraula esmentada s'utilitza de forma figurativa o com a personatge de ficció, sense cometes, com a informació de caràcter més documental.

A més, tots els motors de cerca més importants admeten el símbol "-" no "lògic", així com i / o. Una excepció són termes que no es poden separar mitjançant un guió o guió prefix.

La correspondència inexacta de la frase de cerca es marca amb el símbol ~. Per exemple, si no recordeu la redacció exacta d'un terme o títol, podeu especificar-lo a la cadena de cerca amb el caràcter especificat i podreu obtenir resultats amb la màxima semblança.

Paràmetres de cerca personalitzada

També hi ha paràmetres de cerca com intitle i incategory. Són filtres, que es mostren a través del còlon, en forma de "filtre: cadena de consulta". La cadena de consulta pot contenir el terme o la frase de cerca, o el nom de la pàgina o la part completa.

La funció "intitle: query" dóna prioritat al resultat de la cerca per nom, però també mostra els resultats habituals del contingut del títol. Diversos filtres d'aquest tipus es poden utilitzar simultàniament. Com aprofitar aquesta oportunitat?

La sol·licitud del formulari "intitle: nom de l'aeroport" mostrarà tots els articles que contenen el títol de l'aeroport en el títol. Si ho formuleu com a "estacionament intitle: nom de l'aeroport", rebrà articles amb el nom de l'aeroport en el títol i esmentarà l'estacionament en el text.

La cerca del filtre "incategory: Category" funciona segons el principi de la publicació d'articles pertanyents a un determinat grup o llista de pàgines. Per exemple, una consulta de cerca del tipus "Temperatures incategory: Historial" produirà resultats sobre l'historial dels temples. Aquesta funció també es pot utilitzar com a extensió, establint diversos paràmetres.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ca.atomiyme.com. Theme powered by WordPress.