Supprimer les URL du texte en Python

Supprimer les URL d’un texte en Python #

Utiliser le re.sub() pour supprimer les URL d’un texte, par ex.
result = re.sub(r'http\S+', '', my_string). Le site re.sub() supprime
toutes les URL de la chaîne en les remplaçant par des chaînes vides.

import re

my_string = """
First https://example.com
https://google.com Second
Third https://example.com
"""

result = re.sub(r'http\S+', '', my_string)




print(result)

Nous avons utilisé la méthode re.sub() pour supprimer toutes les URL d’une chaîne.

La méthode re.sub renvoie une
nouvelle chaîne obtenue en remplaçant les occurrences du motif par le remplacement fourni.
remplacement fourni.

import re


my_str = '1apple, 2apple, 3banana'

result = re.sub(r'[0-9]', '_', my_str)

print(result)  

Si le motif n’est pas trouvé, la chaîne est retournée telle quelle.

Nous avons utilisé une chaîne vide pour le remplacement car nous voulons supprimer toutes les URL de la chaîne.

import re

my_string = """
First https://example.com
https://google.com Second
Third https://example.com
"""

result = re.sub(r'http\S+', '', my_string)




print(result)

Le premier argument que nous avons appelé le re.sub() est une expression régulière.

Le site http dans l’expression rationnelle correspondent aux caractères littéraux.

\S correspond à tout caractère qui n’est pas un caractère d’espacement. Notez que l’élément
S est en majuscule.

Le plus + correspond au caractère précédent (n’importe quel caractère autre qu’un espace) 1 ou
fois ou plus.

Dans son intégralité, l’expression régulière correspond aux sous-chaînes commençant par http suivies d’un ou plusieurs caractères sans espace.

Si vous vous souciez de faire correspondre des chaînes de caractères sous la forme de http-somethingmettez à jour votre
expression régulière en r'https?://\S+'.

import re

my_string = """
First https://example.com
https://google.com Second
Third https://example.com
"""

result = re.sub(r'https?://\S+', '', my_string)




print(result)

Le point d’interrogation ? fait correspondre l’expression régulière à 0 ou 1 des répétitions du caractère précédent.

Par exemple, https? correspondra soit à https ou http.

Nous avons ensuite les deux points et deux barres obliques. :// pour compléter le protocole.

Dans son intégralité, l’expression régulière correspond aux sous-chaînes commençant par
http:// ou https:// suivi d’un ou plusieurs caractères autres que des espaces blancs.

Si vous avez besoin d’aide pour lire ou écrire une expression régulière, consultez la rubrique
syntaxe des expressions régulières
dans la documentation officielle.

La page contient une liste de tous les caractères spéciaux avec de nombreux exemples utiles.
exemples utiles.

Laisser un commentaire