Bolanger gestern um 13:33 Uhr · bearbeitet gestern um 13:34 Uhr von Bolanger Hallo, die Sprachmodelle als ein Beispiel für KI sind seit einigen Jahren in aller Munde. Nun suche ich ein tool, mit dem man einen Haufen von Dateien analysieren kann. Ich habe dabei geerbte Informationen vor Auge und bleibe im Sinne des Forums im Bereich Finanzen/Wertpapiere. Der Erbe bekommt einen Haufen Aktenordner mit Papierunterlagen, Computerdateien in einer unbekannten Ordnerstruktur, die teilweise Kontoauszüge oder Kauf-/Verkaufsbescheinigungen von Wertpapieren enthalten. Ein Teil der Dateien besteht aus Scans von Papierunterlagen, die damit doppelt vorhanden sind (als Scan und als Papierunterlage). Der erste Schritt wäre das Scannen der Papierunterlagen, was man selbst machen kann oder einen Service damit beauftragt. Danach müsste man abgleichen, welche Dokumente doppelt vorhanden sind. Eine einfache Suche nach doppelten Dateien funktionieert leider nicht, da sich die Dateien von ein und dem selben Dokument, das mehrmals gescannt wurde und ggf. noch als originäre Datei aus einem Download vorliegt, unterscheiden. Das Tool müsste also den Inhalt der Dokumente abgleichen und Doppelgänger erkennen. Im letzten Schritt müsste dann eine Auswertung der Dokumente erfolgen. Das könnte ein prompt wie "Erstell mir eine Liste der noch vorhandenen Depot-Positionen mit ihren Einstandskursen und Kaufdaten" oder so sein. Gibt es sowas? Gibt es sowas ohne Hochladen der dateien in die Cloud, als etwas, das nur auf dem heimischen Rechner läuft? Grüße Diesen Beitrag teilen Link zum Beitrag
Ramstein gestern um 13:41 Uhr Im Prinzip kann man lokal arbeiten. Mit der entsprechenden Hardware, z. B. https://appleinsider.com/articles/25/03/18/heavily-upgraded-m3-ultra-mac-studio-is-great-for-ai-projects Diesen Beitrag teilen Link zum Beitrag
stagflation gestern um 14:13 Uhr · bearbeitet gestern um 14:18 Uhr von stagflation ...braucht man bloß noch eine Software oder ein KI-Modell, die/das wirklich denken kann... Diesen Beitrag teilen Link zum Beitrag
Bolanger gestern um 14:31 Uhr Die eigentliche Datenanalyse sollte mit einem trainierten KI-Modell recht schnell erreicht sein. Verglichen mit dem Durchforsten des gesamten Internets sollte der Datensatz aus einem Erbe vernachlässigbar gering sein. Texterkennung von gescannten Dokumenten ist heute schon Standard. Auswertung von Text ist eine der Kernanwendungen der Sprach-KI-Modelle. Es geht in meinen Augen quasi nur um die Möglichkeit, ein bestehendes Modell mit eigenen Daten zu füttern und diese Daten nicht öffentlich zu machen. Diesen Beitrag teilen Link zum Beitrag
hattifnatt gestern um 14:59 Uhr vor 15 Minuten von Bolanger: Es geht in meinen Augen quasi nur um die Möglichkeit, ein bestehendes Modell mit eigenen Daten zu füttern und diese Daten nicht öffentlich zu machen. Ja, das ginge. Llama ist für Europa nicht lizensiert, aber Qwen oder DeepSeek sollten geeignet sein (selbst auf einem halbwegs aktuellen Windows-Laptop). Ich wüsste aber aus dem Stegreif nicht, wie man einen solchen Dokumentvergleich effizient (also nicht in O(n^2)) ohne Suchindex bauen würde (oder ohne alle Dokumente im Prompt mitzuschicken, was je nach Anzahl/Größe Probleme machen könnte). Vielleicht kann ein LLM dabei helfen, Dokumentsignaturen zu erzeugen, die sich effizient durchsuchen lassen. Diesen Beitrag teilen Link zum Beitrag
jim. gestern um 15:01 Uhr Dafür ist dann wohl schon ein gewisser Workflow mit Assistants aufzubauen, mit n8n z.B. so ähnlich wie bei https://n8n.io/workflows/2335-build-a-financial-documents-assistant-using-qdrant-and-mistralai/ Diesen Beitrag teilen Link zum Beitrag
hattifnatt gestern um 15:07 Uhr vor 2 Minuten von jim.: Dafür ist dann wohl schon ein gewisser Workflow mit Assistants aufzubauen, mit n8n z.B. so ähnlich wie bei https://n8n.io/workflows/2335-build-a-financial-documents-assistant-using-qdrant-and-mistralai/ Ja, Qdrant als Vectorstore wäre so ein "Suchindex". Diesen Beitrag teilen Link zum Beitrag
EddisHerrchen gestern um 15:56 Uhr Hallo Bolanger, Dokumente von Brokern sind häufig Bilder mit dahinterliegenden Text. Wenn diese als Datei vorliegen, sollten schon maschinell lesbar sein. Dann hast du noch Bilddokumente die du Scannen und mit OCR SW bearbeiten kannst. (ich mache das mit Scannen per Dokumentenscanner (Brother ADS-3600W), ich bin auf Windows Plattform unterwegs, daher ist OCR bei mir ist Omnipage Pro, es gibt aber auch andere leistungsfähige OCR. Die können eigentlich alle Batchverarbeitung.) Mir reicht es die in eine selber definierte Struktur einzusortieren, und ggf. mit Volltextsuche im Explorer zu fischen falls ich mal nicht sofort das passende Dokument finde. Bei mir ist das Datum Teil des Dokumentennamens und sollte auf Scans und in verarbeitbaren Dateien identisch vorhanden sein. Damit könntest Du Doubletten manuell rausfischen. Es gibt Dokumentenmanagement Systeme, die automatisch indizieren die nur lokal arbeiten können und auch eine Dateistruktur behalten, und bis zu einem gewissen Grad trainiert werden können. Ob das aber dann auch die Doubletten findet kann ich Dir aus eigener Erfahrung nicht sagen. Paperless NGX würde mir da einfallen weil es mir aufgefallen ist als ich mich damit beschäftigt hatte: Lokale Installation, Daten auch auf Ordnerstruktur erreichbar, trainierbar bzw lernt selber dazu. Vielleicht lohnt es sich dazu ein paar YT Videos mal anzusehen. Gruß EddisHerrchen Diesen Beitrag teilen Link zum Beitrag
Bolanger gestern um 16:26 Uhr @EddisHerrchen man kann natürlich viel Energie in die händische Aufarbeitung solcher Daten stecken. Es geht ja gerade darum, sich diese Arbeit abnehmen zu lassen. Wenn ich mal durchaus kritisch mich selbst hinterfrage, wie ich bisher mit übergebenen Dateien in größerem Umfang umgegangen bin, dann habe ich mich damit ehrlicherweise nur wenig beschäftigt. Ich denke an geschäftsunterlagen von Kollegen, deren Tätigkeit man aus unterschiedlichen Gründen übernommen hat. Die habe ich irgendwohin gespeichert, um im Fall der Fälle nochmal gezielt nach einer bestuimmten Information zu suchen und ansonsten mit meiner eigenen Organisationsstruktur weitergemacht. Auch für solche Fälle im Geschäftsleben wäre es sehr hilfreich, wenn man sich per Prompteingabe einen Überblick verschaffen könnte ohne alle Dokumente einzeln durchzuarbeiten und ins eigene Organisationssystem zu überführen. Diesen Beitrag teilen Link zum Beitrag
EddisHerrchen gestern um 16:45 Uhr Ah, ok. Da hat mich Deine Ausgangsfragestellung nach Papier und Onlinedokumenten wohl aufs falsche Gleis geschickt. Aber generell ist es genau das was Du suchst: Ein lokales DMS das deine Daten schnell auswertbar macht. Ob der Aufwand ein KI Modell zu finden und lokal lauffähig zu machen im vergleich zu einem DMS da niedriger oder höher ausfällt, kann ich nicht beurteilen. Spannendes Thema. Diesen Beitrag teilen Link zum Beitrag
stagflation gestern um 17:14 Uhr · bearbeitet vor 23 Stunden von stagflation vor einer Stunde von Bolanger: Ich denke an geschäftsunterlagen von Kollegen, deren Tätigkeit man aus unterschiedlichen Gründen übernommen hat. Auch für solche Fälle im Geschäftsleben wäre es sehr hilfreich, wenn man sich per Prompteingabe einen Überblick verschaffen könnte ohne alle Dokumente einzeln durchzuarbeiten und ins eigene Organisationssystem zu überführen. Ja, das kenne ich aus dem Business-Umfeld. In manchen Textverarbeitungs-Tools gibt es neuerdings eine "Automatische Zusammenfassung". Also... ein Mitarbeiter bekommt eine Aufgabe, die er bearbeiten soll. Er arbeitet mehrere Wochen an dem Thema, macht sich richtig Mühe, findet tolle Ergebnisse und schreibt ein 70-seitiges Dokument. Sein Chef hat keine Lust, das alles zu lesen - und lässt sich eine "Automatische Zusammenfassung" schreiben. Das dauert 5 Sekunden und ist ungefähr eine halbe Seite. Die Zusammenfassung kann er zwischen Mittagspause und dem wöchentlichen Führungsmeeting lesen - und dort berichten, was sein Mitarbeiter herausgefunden hat. Wer solche Zusammenfassungen mal gelesen hat, weiß, was dabei herauskommt. Manchmal kommt es ungefähr hin, manchmal nicht. Diesen Beitrag teilen Link zum Beitrag
hattifnatt vor 23 Stunden vor 3 Minuten von stagflation: Ja, das kenne ich aus dem Business-Umfeld. In Microsoft Tools gibt es den "Copilot". Ach, daher kommt deine KI-Skepsis - der ist echt Schrott. Diesen Beitrag teilen Link zum Beitrag
Bolanger vor 22 Stunden Bei diesen tools kann man meiner Erfahrung nach mit allem arbeiten, dass bei jeder Behauptung direkt den Link zur Quelle enthält. So kann man schnell nachschauen, ob die Zusammenfassung in dem Punkt stimmt. Ansonsten sind meine Erfahrungen mit automatisiert erstellten Berichten zu Videokonferenzen durchaus positiv. Beiindruckend finde ich dabei schon, dass Smalltalk ausgeblendet wird und Informationen, die zum gleichen Thema zu unterschiedlichen Zeit mitgeteilt wurden, zusammengefasst werden. Wir stehen erst am Anfang dieser Enzwicklung. Bei allem, was innerhalb der letzten 2 Jahre geschehen ist müsste es eine taugliche Funktion in wenigen Jahren geben. Diesen Beitrag teilen Link zum Beitrag