keessie100 Geplaatst: 2 augustus 2011 Geplaatst: 2 augustus 2011 Hoi allemaal, Ik ben niet zo thuis in debian maar ik zoek en editer om csv bestanden uit te kleden en zo te maken met de informatie die ik erin wil hebben staan. Het bestand wordt door derde partij compleet aangeleverd, maar er moet een hoop uitgeloopt worden en een paar kleine dingen aangepast. Het gaat er nu om dat als ik het progje start dat deze automatisch het bestand compleet aanpast. Dus er moet een zoekfunctie inzitten die een complete regel kan verwijderen en ook kolommen waar een bepaalde waarde in staat. Daarna moet het bestand opnieuw wegeschreven worden op een andere plek. Wie heeft er een opzetje voor me?? Ik weet even niet waar ik moet beginnen namelijk. Het scripje komt op een lokale debian server te draaien, dus alleen command line. Dus even het stappenplan voor de duidelijkheid: 1e dowloaden vanaf andere server op ftp. 2e opslaan lokaal 3e bestand openen en bewerken, wat er moet gebeuren is per leverancier vastgelegd in het script. 4e opslaan op een andere plek met datum en tijd erbij en een opvolgende naam ivm niet overschrijven oude bestand. Alle hulp is welkom.
Beheerder Michel Geplaatst: 3 augustus 2011 Beheerder Geplaatst: 3 augustus 2011 Zo te horen gaat dit om een zakelijke transactie en om die reden kan je er ook beter gewoon (betaalde) hulp bij inroepen. Je weet zelf duidelijk niet hoe je het aan moet pakken en op zo'n moment roep je als bedrijf de hulp van een specialist in. Ik kan me haast niet voorstellen dat er leden zijn die een dergelijk script gratis voor je willen schrijven, maar wie weet? Mvg, Michel Gebruik je een advertentie blocker? Sluit onze website dan uit. Zonder advertenties kan deze site niet voortbestaan.
Lucky_Luke Geplaatst: 3 augustus 2011 Geplaatst: 3 augustus 2011 Kan eenvoudig met Perl of Python scriptje, waarschijnlijk kom je met sed ook een heel eind... Succes...
keessie100 Geplaatst: 3 augustus 2011 Auteur Geplaatst: 3 augustus 2011 Michel, je bent nu wel erg negatief he. We zijn hier om elkaar te kunnen helpen enzo maar in de grond boren lijk me hier niet op zn plaats, maarja zo mag men dus niks zelf leren. En als het zakelijk is wat maakt dat uit, je kan dingen beter zelf weten dan dat je niks weet want kennis is macht. Maar eh met een Perl scripje lijk het mij ook wel te kunnen, maar hoe aanpakken das even mijn probleem, hoe kan ik em laten zoeken en dat de kolom of regel verwijderen bijvoorbeeld. Ik heb er nog niet zo veel meegedaan dusja, het downloaden enzo is niet zo'n probleem maar het automatisch bewerken is eerder mn probleem.
Tonskidutch Geplaatst: 3 augustus 2011 Geplaatst: 3 augustus 2011 dan hoort zoiets thuis in te koop gevraagd. punt Coles Corner Richard Hawley
Lamko Geplaatst: 3 augustus 2011 Geplaatst: 3 augustus 2011 Als je een script taal al een beetje kent zou ik daar maar eens een beetje meer in gaan verdiepen. Tot je concreet wat code hebt dan kunnen we je daarna wel verder helpen. Nu komt het een beetje over als "help me een scriptje te schrijven" en dat is hier ook niet de bedoeling. Mythbuntu 12.04 Celeron 220 op Mini-ITX D201GLY2, 1 GB Ram,2x1,5 TB HDD, Digitenne op TerraTec Cinergy, CCcam
keessie100 Geplaatst: 3 augustus 2011 Auteur Geplaatst: 3 augustus 2011 Wat ik nog nooit gedaan heb is een tabel zeg maar uitkleden waarvan een aantal rijen waarin een cel met bepaalde inhoud zit die te laten verwijderen en dat geld ook voor de kolommen die eruit moeten. Op google ben ik ook al zoekende geweest maar kan er eigenlijk niks over vinden. Als ik dat weet hoe ik het moet aanpakken / doen met een stukje voorbeeld code dan ben ik al een heel eind geholpen.
Beheerder Michel Geplaatst: 3 augustus 2011 Beheerder Geplaatst: 3 augustus 2011 Ten eerste is een CSV file geen file met kolommen en rijen, maar gewoon een plain tekstbestand met (eventueel veldmarkeringen en) seperators. Voorbeeld: "bladiebla;"blabla-1";"blabla-2" Maar ook geldig is: bladiebla;blabla-1;blabla2 Maar dit kan ook (vreemde tekens) "bladie'bla'";"blabla$2";"blabla;2" Aan de hand van die seperators en de veldmarkeringen (") en het eenvoudigweg tellen van de seperators kan je dus vaststellen waar je data staat. Dat is weer eenvoudig in een script af te handelen. Zoek in die richting en dan gaat het wel lukken. Mvg, Michel Gebruik je een advertentie blocker? Sluit onze website dan uit. Zonder advertenties kan deze site niet voortbestaan.
Gast Tha Great Mac Geplaatst: 3 augustus 2011 Geplaatst: 3 augustus 2011 Wat met name belangrijk is, dat je weet wat de separator is. Het kan een , zijn, maar ook een ; of zelfs een spatie.
Beheerder Michel Geplaatst: 4 augustus 2011 Beheerder Geplaatst: 4 augustus 2011 Als het echt csv formaat is, kan het zeker geen spatie zijn en is het ofwel een comma, ofwel een punt-comma en wordt in velden waarin de seperator als waarde voorkomt, de waarde omsloten met dubbele quotes. Ofwel: dit is een test,"dit is, een test" Mvg, Michel Gebruik je een advertentie blocker? Sluit onze website dan uit. Zonder advertenties kan deze site niet voortbestaan.
Gast Tha Great Mac Geplaatst: 4 augustus 2011 Geplaatst: 4 augustus 2011 Dat is zo, maar dit soort formaten worden nogal eens 'misbruikt' door het toch in andere vormen toe te passen. Gewoon even op letten dus.
Lucky_Luke Geplaatst: 4 augustus 2011 Geplaatst: 4 augustus 2011 En als spuit 11 wil ik nog opmerken dat CSV geen 'formele standaard' is. Er zijn slechts RFC's waarin omschreven wordt wat 'gangbaar' is voor CSV files. Alhoewel ik het eens ben met Michel heb ik toch bizarre zaken gezien in CSV files. Python en Perl zijn wat dat betreft vaak de makkelijkste tools om hiermee om te gaan.
Beheerder Michel Geplaatst: 4 augustus 2011 Beheerder Geplaatst: 4 augustus 2011 Er is wel degelijk een standaard (RFC 4180) hoor: http://tools.ietf.org/html/rfc4180 Zoals het hier beschreven is, is het in ieder geval heel gebruikelijk, maar het klopt dat men andere zelf gebakken formaten nog wel eens csv wil noemen. Mvg, Michel Gebruik je een advertentie blocker? Sluit onze website dan uit. Zonder advertenties kan deze site niet voortbestaan.
Lucky_Luke Geplaatst: 4 augustus 2011 Geplaatst: 4 augustus 2011 rfc4180: Citaat: Status of This Memo This memo provides information for the Internet community. It does not specify an Internet standard of any kind. Distribution of this memo is unlimited. En: Citaat: Definition of the CSV Format While there are various specifications and implementations for the CSV format (for ex. [4], [5], [6] and [7]), there is no formal specification in existence, which allows for a wide variety of interpretations of CSV files. This section documents the format that seems to be followed by most implementations: De standaard zit hem eigenlijk in de naam, zoals je al een beetje aangaf, COMMA en semi COLUMN
Beheerder Michel Geplaatst: 4 augustus 2011 Beheerder Geplaatst: 4 augustus 2011 Klopt, maar RFC is er natuurlijk niet voor niets. Als iedereen zijn eigen standaard gaat bedenken, kom je nooit tot een echte standaard. Alle grote jongens respecteren dit document wel zon beetje. Mvg, Michel Gebruik je een advertentie blocker? Sluit onze website dan uit. Zonder advertenties kan deze site niet voortbestaan.
Aanbevolen berichten
Maak een account aan of log in om te reageren
Je moet een lid zijn om een reactie te kunnen achterlaten
Account aanmaken
Registreer voor een nieuwe account in onze community. Het is erg gemakkelijk!
Registreer een nieuwe accountInloggen
Heb je reeds een account? Log hier in.
Nu inloggen