Cette page présente des statistiques sur les requêtes tapées dans des moteurs de recherche comme Google. Afin de réaliser ces statistiques, des ensembles de données provenant de différents moteurs de recherche ont été collectés et traités.
L'ensemble de données est composé de deux sources principales :
La langue des données est principalement l'anglais et le français.
Voici un extrait du jeu de données qui est composé d'un peu plus de 26000 requêtes :
"how to use itertools.product in python?", 1
"how to write inverse of function in latex", 1
"how were you programmed", 1
"how work out angles", 1
"how's your day", 1
"how's your day?", 2
"hp z420", 3
"hpgr compressive force", 2
"hrllo", 1
"hrv pays", 338
"html", 4
"html checkbox", 1
"html description longueur", 1
Après avoir traité le jeu de données avec une moulinette en Python, le graphique suivant présente la longueur des requêtes :
La première observation est qu'il y a deux pics, autour de 20 et 45 caractères. En analysant les requêtes, on voit clairement qu'il y a deux types de requêtes :
Voici un exemple de requêtes de 20 caractères de long:
prédécesseur féminin
puerto rico habitant
python list -1 index
python list index -1
python requests ajax
quartier des affaire
quaternion conjugate
quaternion normalize
quaternions rotation
que veut dire mougou
quel âge a Madonna ?
quelque soit symbole
quill.root.innerhtml
racine cubique latex
racine n-ième latex
Voici un exemple de requêtes de 45 caractères de long:
convert miles per hour to kilometers per hour
convertir tour par seconde en tour par minute
différence disjoncteur entre MSN et HPI ou SI
ensemble forme par une ville et ses banlieues
exprimer le pourcentage sur le clavier azerty
faut il mettre une majuscule au nom de langue
formule de politesse courrier à un chirurgien
formule tour par minute en radian par seconde
habitants de la suisse on les appelle comment
how to convert linear velocity (m/s) to rad/s
il existe combien de continent dans ce monde?
javascript check if string is only whitespace
javascript check if string is whitespace only
javascript remove carriage return from string
javascript remove return carriage from string
je ne manqueraipas de vous tenir informé dès
latex ecrire une formule sur plusieurs lignes
La longueur moyenne est de 32,5 caractères.
Le plus intéressant est que la longueur des requêtes est généralement inférieure à 50 caractères. En traçant le graphique cummulé, on peut même affirmer que 90% des requêtes font moins de 50 caractères :
En traçant la longueur sur une échelle logarithmique, on peut mieux voir les extrêmes :
Les requêtes les plus courtes sont composées d'un seul caractère :
,
?
g
f
C
W
y
a
💚
H
ي
s
X
~
Les requêtes longues de quatre caractères sont également intéressantes. Elles sont composées d'un seul mot comme :
Mint
Logo
html
prêt
Audi
2021
sony
Holà
U=RI
La plupart des mots liés au sexe sont courts :
fuck
porn
sexe
La dernière partie intéressante sont les calculs :
45/6
52/6
66/6
41/6
76/2
43*7
65*8
78*2
86*8
35+7
13*7
14*7
33+9
72/2
26*8
18*8
6*24
13*6
2*38
Maintenant, regardons les requêtes longues. Commençons par la requête la plus longue (274 caractères) :
6) The rotating blade of a blender turns with constant angular acceleration 20 revolutions per minutesecond. (a) How much time does it take to reach an angular velocity of 344 RPM starting from rest? (b)Through how many revolutions does the blade turn in this time interval?
C'est clairement quelqu'un qui a copié ses devoirs dans le moteur de recherche !
Si nous regardons les autres requêtes longues, en voici quelques-unes qui sont intéressantes. La plupart sont des textes copiés dans le moteur de recherche :
Hello, Excuse me for this way of contacting you, I just saw your profile and I thought that you are the person I need. In short, my name is Madame Pierrette Vachon, of Dutch origin and I live in France. I suffer from a serious illness which condemns me to
There is a clever kitchen gadget for drying lettuce leaves after you wash them. It consists of a cylindrical container mounted so that it can be rotated about its axis by turning a hand crank. The outer wall of the cylinder is perforated with small holes.
Question 2(a & b) is based on this scenario. You are the sales manager for Black and Decker, in charge for industrial screwdriver market. Salim is a recruit working under your supervision. Question 2 a. Guide him on getting more prospects for him
Un peu de code!
static void f1 ( int t , int size ){for ( int i = 0; i < size ; i += 2 ){int p = t + i ; p = i 10;}}
Comme pour les très courtes, certains utilisateurs saississent des calculs :
0.1*(log(1.05)+log(1.15)+log(1.25)+log(1.35)+log(1.45)+log(1.55)+log(1.65)+log(1.75)+log(1.85)+log(1.95))
1+0.00356+0.00366+0.00558+0.08811+0.0039+0.08811+0.0036+0.08811+0.0043+0.08811+0.00377+0.08811+0.0037+0.08811