Articles of Python

Parsing HTML in Python – Lxml oder BeautifulSoup? Welche davon ist besser für welche Zwecke?

Von dem, was ich ausmachen kann, sind die beiden wichtigsten HTML-Parsing-Bibliotheken in Python lxml und BeautifulSoup. Ich habe BeautifulSoup für ein Projekt ausgewählt, an dem ich gerade arbeite, aber ich habe es aus keinem anderen Grund gewählt, als die Syntax etwas leichter zu finden und zu verstehen. Aber ich sehe eine Menge Leute, die lxml […]

Wie wandle ich eine Datei in ein Wörterbuch um?

Ich habe eine Datei mit zwei Spalten, dh 1 a 2 b 3 c Ich möchte diese Datei in einem Wörterbuch lesen, so dass Spalte 1 der Schlüssel und Spalte 2 der Wert ist, dh d = {1:’a’, 2:’b’, 3:’c’} Die Datei ist klein, Effizienz ist also kein Problem.

Extrahieren von Text aus einer PDF-Datei mit Python

Ich versuche, den in dieser PDF-Datei enthaltenen Text mit Python zu extrahieren. Ich verwende das PyPDF2- Modul und habe folgendes Skript: import PyPDF2 pdf_file = open(‘sample.pdf’) read_pdf = PyPDF2.PdfFileReader(pdf_file) number_of_pages = read_pdf.getNumPages() page = read_pdf.getPage(0) page_content = page.extractText() print page_content Wenn ich den Code ausführe, erhalte ich die folgende Ausgabe, die sich von der im […]

Sind Python-Strings nicht unveränderbar? Warum funktioniert dann ein + “” + b?

Mein Verständnis war, dass Python-Strings unveränderlich sind. Ich habe den folgenden Code ausprobiert: a = “Dog” b = “eats” c = “treats” print a, b, c # Dog eats treats print a + ” ” + b + ” ” + c # Dog eats treats print a # Dog a = a + ” […]

Was bedeutet ein String-Literal vor “r”?

Ich habe es zum ersten Mal beim re.compile() regulärer Ausdrücke über mehrere Zeilen hinweg als Methodenargument für re.compile() , also nahm ich an, dass r für RegEx steht. Beispielsweise: regex = re.compile( r’^[AZ]’ r'[A-Z0-9-]’ r'[AZ]$’, re.IGNORECASE ) Was bedeutet r in diesem Fall? Warum brauchen wir es?

Fehler: “‘dict’ Objekt hat kein Attribut ‘iteritems'”

Ich versuche, NetworkX zu verwenden, um eine Shapefile zu lesen und die function write_shp() zu verwenden, um die Shapefiles zu generieren, die die Knoten und Kanten enthalten (nach diesem Beispiel <- dieser Link ist jetzt tot ), aber wenn ich versuche, das auszuführen code gibt mir den folgenden Fehler: Traceback (most recent call last): File […]

Was ist der Unterschied zwischen `sorted (list)` vs `list.sort ()`?

list.sort() sortiert die Liste und speichert die sortierte Liste, während sorted(list) eine sortierte Kopie der Liste zurückgibt, ohne die ursprüngliche Liste zu ändern. Aber wann soll was benutzt werden? Und was ist schneller? Und wie viel schneller? Können die ursprünglichen Positionen einer Liste nach list.sort() abgerufen werden?

Die beste Möglichkeit, Integer als String mit führenden Nullen zu formatieren?

Ich muss führende Nullen zu Integer hinzufügen, um eine Zeichenfolge mit einer definierten Anzahl von Ziffern ($ cnt) zu erstellen. Was ist der beste Weg, um diese einfache function von PHP nach Python zu übersetzen: function add_nulls($int, $cnt=2) { $int = intval($int); for($i=0; $i<($cnt-strlen($int)); $i++) $nulls .= '0'; return $nulls.$int; } Gibt es eine function, […]

Was ist der beste (idiomatische) Weg, um den Typ einer Python-Variablen zu überprüfen?

Ich muss wissen, ob eine Variable in Python eine Zeichenfolge oder ein Diktat ist. Ist der folgende Code falsch? if type(x) == type(str()): do_something_with_a_string(x) elif type(x) == type(dict()): do_somethting_with_a_dict(x) else: raise ValueError Update : Ich akzeptierte die Antwort von avisser (obwohl ich meine Meinung ändern werde, wenn jemand erklärt, warum isinstance gegenüber type(x) is ). […]

Finden, welche Methoden ein Python-Objekt hat

Bei einem Python-Objekt jeder Art gibt es einen einfachen Weg, die Liste aller Methoden zu erhalten, die dieses Objekt hat? Oder, Wenn dies nicht möglich ist, gibt es zumindest einen einfachen Weg, um zu überprüfen, ob es eine bestimmte Methode gibt, außer einfach zu prüfen, ob beim Aufruf der Methode ein Fehler auftritt?