Recherche

7

Google renouvelle son ICP, ça veut dire quoi ?

No Gravatar

Je ne voulais pas vraiment reparler de cette histoire, mais j’ai lu des conneries en français comme en anglais sur des sites ou des blogs que je ne citerai pas. Je ne vais pas m’étaler non plus, et pour ceux qui veulent plus de détails, lisez cet article sur China/Divide.

Toute entreprise possédant un site Internet basé en Chine doit disposer d’une licence ICP. Cette licence n’est pas éternelle et doit être renouvelée.

Comme toutes les entreprises présentes en Chine, Google a du renouvelé sa licence afin de continuer à opérer en Chine. Et contrairement à ce qui peut se dire ailleurs sur le net, cela ne veut en aucun cas dire que Google réouvre son moteur de recherche en Chine continentale !!! En renouvelant cette licence, Google ne revient pas en Chine la queue entre les jambes et Google ne cède pas devant le gouvernement chinois.

1. Google a fermé son moteur de recherche en Chine

Depuis plusieurs mois maintenant Google a fermé son moteur de recherche sur le continent et a commencé à rediriger les internautes vers la version hongkongaise du moteur. Depuis lors, Google ne possède plus de moteur de recherche en Chine continentale et n’a donc plus à censurer les résultats des recherches. La redirection automatique aura été bien vue, Google n’a pas arrêté de censurer le contenu mais a tout simplement stopper le moteur, restant ainsi dans la légalité.

2. Google n’est pas qu’un moteur de recherche

Il est important de comprendre que Google propose d’autres services : publicité, musique, maps, système d’exploitation mobile, etc. La licence du site Google.cn est donc très importante même si Google ne propose plus d’outil de recherche.

3. La licence et la redirection

La redirection vers Hong Kong a marché dans le sens où le gouvernement chinois n’a pas bronché. Par contre, il était clair qu’au moment du renouvèlement de la licence, Google ne s’en tirerait pas comme ça.

Afin d’éviter les problèmes, Google a donc cessé la redirection. A la place, la partie centrale de la page web est maintenant une image qui renvoie vers Google HK quand on y clique. La différence ? D’un point de vue utilisateur, elle est maigre ! En voulant placer votre curseur dans le champs de texte vous cliquez sur l’image et vous retrouvez sur Google HK presque comme si de rien était. Par contre, techniquement, Google ne redirige plus les utilisateurs de Google.cn vers la version hongkongaise du site, ce qui pouvait être vu comme une provocation envers le gouvernement.

4. Google ne revient pas, il reste en Chine

Ceux qui pensent que l’entreprise revient n’ont semble-t-il pas tout saisi… Répétons donc encore une fois. Google n’est jamais parti de Chine, l’entreprise a juste arrêté son moteur de recherche sur le continent et renvoyé les utilisateurs vers Hong Kong. Si Google n’est pas parti, pourquoi dit-on qu’elle revient ?

En renouvelant sa licence, Google a assuré le maintien de ses activités web en Chine (encore : pas la recherche qui n’est plus !). La seule chose qui a été cédé dans l’histoire c’est la redirection automatique qui n’aurait de toute façon pas tenu bien longtemps. Mais nous l’avons vu, le lien vers Google HK se fait quand même de façon quasi automatique, il faut juste un clic de plus…

Il n’est en aucun question d’une réouverture du moteur de recherche en version chinoise. Google, grâce au renouvèlement, s’est vu confirmé qu’elle respectait bien la loi chinoise et qu’elle pouvait continuer ses activités en Chine. Et c’est cela qu’il faut bien comprendre ! Après l’arrêt du moteur de recherche chinois, les utilisateurs sont toujours plus ou moins automatiquement renvoyés vers Google Hong Kong, et par le renouvèlement de la licence de Google, le gouvernement approuve cette pratique ! C’est donc bien une victoire pour l’entreprise américaine et non pas une défaite ou un retour la queue entre les jambes…

Note : Je tiens à m’excuser pour les innombrables répétitions mais c’était nécessaire.

Je vous invite à partager votre point de vue dans les commentaires, surtout si vous n’êtes pas d’accord, car j’aimerais bien avoir d’autres avis sur cette affaires.

– Woods

3

Le retour de flamme pour Google ?

No Gravatar

Ce soir vers 19 heures (Heure de Chine), les recherches depuis Google.com ou Google.com.hk (Version hongkongaise du moteur de recherche vers lequel les internautes chinois sont désormais redirigés) semblaient ne plus aboutir. A 21 heures, j’arrive à passer quelques recherches, mais la majorité aboutissent à une page blanche et le moteur de recherche devient injoignable pendant 1 ou 2 minutes.

Sur Google.com les recherches semblent passer la plupart du temps, mais c’est surtout sur Google.com.hk que le problème survient. Par exemple, j’ai pu chercher tiananmen mais un peu après impossible de chercher taobao (la version chinoise d’Ebay)…

Google subirait-il le retour de flamme du gouvernement chinois ?

En redirigeant tous les internautes chinois vers Google Hong Kong, version en chinois et non censurée du moteur, l’entreprise de Mountain View avait fait un beau pied de nez au gouvernement chinois. La seule mesure que ce dernier a entreprit jusqu’à présent aura été de renforcer le contrôle de l’information en faisant effacer tous les articles, discussions ou commentaires pro-Google du net chinois.

Il fallait donc s’attendre à une réaction de plus grande ampleur.

Même si un blocage total des recherches ou des services Google semble peu réaliste, rien n’est impossible. Rappelez-vous qu’à la suite des heurts survenus au Xinjiang en juillet 2009, toutes les communications vers l’extérieur avaient été coupées. Pour vous donner une idée, je vous invite à lire cet article (bloqué en Chine) de Farwest China où Josh raconte une conversation avec sa banque aux Etats-Unis dans laquelle il essaye d’expliquer qu’il n’a pas pu régler sa situation à temps car il n’a pas eu accès ni au net, ni au téléphone vers l’étranger pendant 6 mois.

On ne peut donc pas écarter un blocage complet mais à mon avis, perturber les connexions vers Google et ses services est la meilleure solution pour le gouvernement chinois :

  1. Cela évite de s’attirer les critiques de l’étranger car de l’extérieur tout semble normal.
  2. Les utilisateurs las de subir des ralentissements réguliers se tourneront vers d’autres moteurs de recherche.

Dans tous les cas, il existe des outils gratuits pour contourner simplement la censure (Lire cet article où j’explique comment utiliser l’un d’entre eux).

Je profite de cet article pour vous faire découvrir (ou redécouvrir) BaiGoogleDu qui permet de lancer votre recherche dans Google et Baidu en simultané et d’afficher les résultats dans une page scindée en deux. Vous remarquerez qu’en cherchant tiananmen (pas en chinois) le second résultat est un article du Huffington Post qui parle bien des événements de juin 89 et n’est pas censuré. Comme quoi…

– Woods

8

WordPress : encoder du texte dans vos articles

No Gravatar

En écrivant mon dernier article, j’ai eu besoin d’encoder certaines informations pour les rendre illisibles aux robots. Je voulais donc expliquer comment faire ça sous WordPress, comment ça marche et surtout pourquoi.

Comment ça marche ?

Une page web, c’est du code HTML. Le code se présente sous forme de texte avec une syntaxe assez simple. On y ajoute une ou plusieurs CSS pour définir le style. Et le boulot principal de votre navigateur, c’est de mettre en forme le HTML et de l’afficher. Ensuite, la page web peut embarquer des animations exécutées par un programme extérieur (Flash ou Java par exemple) et du Javascript, un langage de script exécuté par le moteur Javascript de votre navigateur.

Sur un site web, il y a deux types de visiteurs : les humains et les robots. Les humains « voient » le site mis en forme par le navigateur tandis que les robots ne font que lire le contenu de la page HTML. Il y a aussi les informaticiens qui savent faire les deux ! :)

Les moteurs de recherche ont une horde de robots qui parcourent le net en permanence pour indexer le contenu du plus grand nombre de sites possibles pour vous les proposez lors de vos recherches. Et puisqu’ils ne lisent que le HTML, le contenu en Javascript ou en Flash n’est pas indexé.

Conclusion : pour éviter que quelque chose ne soit lu par les robots, il faut l’écrire avec autre chose que du HTML, et de préférence, il faut encoder le tout.

Pourquoi ?

Certaines infos que vous écrivez sur Internet peuvent être sensibles. Si ces infos sont à destination des lecteurs de votre blog, elles doivent bien évidemment être lisibles pour les visiteurs mais il est préférable que ces données ne puissent pas être récupérées automatiquement par des robots.

Exemple 1 : votre adresse mail, elle doit être disponible sur votre site mais il faut éviter que des spameurs ne la récupèrent.

Exemple 2 : du texte pouvant être sujet à la censure. Car la censure du web en Chine, fonctionne à peu près comme Google, sauf qu’au lieu de référencer ce qu’ils trouvent, les robots se contentent de surveiller une liste de mots clés tabous…

PHPEnkode plugin

Mon blog est propulsé par WordPress. J’ai donc cherché un plugin capable de faire ça. Il y a peut-être un meilleur plugin, mais PHPEnkoder fait exactement ce que je cherche. Par défaut le plugin encodera les adresses mail présentes sur votre blog, mais vous pouvez changer ça dans les options.

Pour l’utiliser dans un article, il suffit d’entourer le texte à encoder des balises [_enkode_] et [_/enkode_] (sans les _ bien sûr), et le tour est joué ! Vous ne pouvez pas encoder tout un article, il doit y avoir une limite de 1000 caractères ou quelque chose comme ça. Si vous voulez plus d’infos, allez sur le site du plugin.

Pour le visiteur, il n’y a strictement aucune différence. Mais un robot verra ça à la place du texte encodé :

<script type="text/javascript">
/* <!-- */
function hivelogic_enkoder_1_2083649660() {
var kode="kode=\"110 114 103 104 64 37 52 52 51
35 52 52 55 35 52 51 54 35 52 51 55 35 57 55 35
[etc (il y a des centaines de chiffres comme ça formant le code)]
52 35 55 59 35 56 53 35 52 52 60 35 52 51 \";
kode=kode.split(\' \');x=\'\';for(i=0;i<kode.length;i++){
x+=String.fromCharCode(parseInt(kode[i])-3)}
kode=x;";var i,c,x;while(eval(kode));
}
hivelogic_enkoder_1_2083649660();
var span = document.getElementById('enkoder_1_2083649660');
span.parentNode.removeChild(span);
/* --> */
</script>

Bref, un robot n’exécutera pas le Javascript. Et l’information doit être décodée, ce qui ne prendra que quelques dixièmes de secondes à votre navigateur.

Si vous avez à parler de sujets sensibles, pensez-y !

– Woods

1

Recherche réparée !

No Gravatar

Je viens de corriger le problème de la fonction de recherche du blog. Le thème Dilectio que j’utilise ne sait pas paginer les résultats des recherches donc on ne pouvait jamais voir les résultats après la première page.

J’ai trouvé un petit bout de code qui règle le problème sur http://txfx.net/code/wordpress/nice-search/ que j’ai juste copié dans les fonctions du thème et ça remarche !

Si vous voyez d’autres choses pas normales sur le site hésitez pas à m’envoyer un petit mail ou à laisser un commentaire.

Bonne recherche !

– Woods

Mots-clés : , ,
2

Ils sont arrivés sur woodsb.net

No Gravatar

C’est toujours marrant de jeter un oeil aux statistiques d’un blog et notamment aux recherches qui ont amené des internautes à le visiter. Voici un petit palmarès des recherches qui ont (parfois mystérieusement) abouties ici.

The winner

Les deux termes les plus fréquents sont Mao et Mao Zedong. Cela est du aux photos que j’ai mises dans ces articles .

Le lourd

J’avais posté ici un article presque inutile qui est, grâce aux recherches Google, le plus visité du blog en raison de son titre : Mal à la nuque…

Le trompeur

Beaucoup de gens arrivent sur ce blog après avoir chercher Marche des fiancés. J’avais bien écrit un article sur le Marché aux fiancés de Shanghai, rien à voir avec la Marche des Fiancés de Wagner.

Les improbables

Les recherches qui ont amené des internautes ici sans qu’on sache trop pourquoi :

  • h k opart n
  • retour au calme en classe
  • phtos de feuille et leur information
  • Ma?
  • réponse jeux de reflexion japonais pour traverser la rivière

Les questions

Certaines recherches sont faites sous forme de question, essayons d’aider les internautes dans le besoin…

qu’est ce que c’est une amplitude thermique : C’est la différence entre la température la plus basse et la plus haute sur une certaine période (à cause de cet article).

c’est quoi un soupçon : C’est une très petit quantité de quelque chose, ou bien un doute sur quelque chose.

que veut dire grande echelle : Attention, cette question contient un piège ! Ca veut dire que l’échelle est plutôt grande, mais on parle aussi de la grande échelle, un véhicule utilisé par les pompiers (à cause de mon article sur GLadder, la grande échelle).

différence entre shanghai et guizhou : Shanghai est une ville et le Guizhou est une province.

c quoi le soulèvement : c’est l’action de soulever, mais aussi comme c’est arrivé dans le Guizhou, cela peut être un synonyme de rebellion.

Les affirmations

j’arrive à Hong Kong : c’est cool…

on bouffe n importe quoi en Chine : on y mange de tout c’est vrai, mais pas n’importe quoi !

Mes préférés

article à lire absolument : j’espère qu’il y en a sur ce blog !

image de petit déjeuner du monde mes vraiment des petit déjeuner : il y a bien 2 articles parlant de petit déjeuner typiquement chinois ici et , et des vrais en plus.

hair LABO : hu hu ! c’est vrai que j’avais mis en ligne des photos de mon Hair Labo.

BLOG BI SEXUEL : A cause de cet article, uniquement !! :)

Le meilleur pour la fin

Quelqu’un a réussi a tombé sur ce site en lançant la recherche suivante :

culture allemande -hautetfort -lemonde -midiblog -uniterre -inurl:blogspot -inurl:over-blog -presse

Sans commentaire.

– Woods

Mots-clés : , ,
0

Recherche sur Internet en Chine

No Gravatar

Lorsque je cherche quelque chose sur Internet, je fais en général une recherche par mots clés, et je pense que la plupart des gens que je connais font la même chose.

Une recherche par mots clés, ça correspond simplement à utiliser des termes généraux pour faire une recherche, exemple :

Pour chercher le prix d’un trajet en train entre Paris et Marseille, on va taper « Paris Marseille train prix » dans un moteur de recherche.

En Chine, j’ai remarqué à plusieurs reprises qu’une bonne méthode pour trouver une réponse à un problème est de taper la question directement dans un moteur de recherche que ce soit Google ou Baidu, exemple :

« Quel est le prix d’un billet de train entre Paris et Marseille ? » (en chinois on est d’accord)

On trouve très souvent des sites Internet où les gens posent des questions comme celle du dessus, et où l’on trouve bien entendu la réponse. Ce qui rend la recherche efficace.

L’avantage est que la réponse se trouve le plus souvent en première position dans la liste des résultats. Mais c’est bien sûr facilité par la construction des phrases en Chinois, une question comme celle du dessus sera écrite de la même façon par la majorité des gens, contrairement au français !

Des sites web du genre sont courants en Chine, mais en France ca court pas les rues ! En cherchant (rapidement) j’ai trouvé :

Quand on a l’habitude de la recherche par mots clés ça fait drôle de voir ça, mais en connaissant un peu le Chinois, on comprend mieux pourquoi c’est très efficace.

– Woods