Seneste forumindlæg
Køb / Salg
 * Uofficiel Black/White liste V3
Login / opret bruger

Forum \ Software \ Generel software
Denne tråd er over 6 måneder gammel

Er du sikker på, at du har noget relevant at tilføje?

Hente alle billeder fra hjemmeside (DownloadThemAl...

Af Junior Supporter TLW | 23-03-2021 20:23 | 2685 visninger | 21 svar, hop til seneste
Hej. Sidder og forsøger at hente alle billeder ned fra vores ene barns børnehave. Jeg har før benyttet DownloadThemAll, men nu er der ændret på det. Hvis jeg bare står på hovedsiden og vælger at downloade dem alle, så får jeg billeder på 20KB. Åbner jeg billedet og vælger download på det, så får jeg en fil på ca. 500KB og billedet er i en størrelse man rent faktisk kan se. Det andet ligner mere et tumbnail. Hovedsiden hvor jeg kan hente alle hedder: (ABC erstatter det rigtige link) https://mitguld.ABC.dk[...] Siden til det åbne billeder hedder: (X.Y erstatter det rigtige link) https://x.y.dk[...] Er der nogen af Jer som kan hjælpe? Det skal være klaret til fredag, så det haster lidt. Jeg havde forventet at kunne gøre det som før og nu er der selvfølgelig problemer :(
--
He who runs today. Lives to run another day! - Red Dwarf
#1
Mentalias
Bruger
24-03-2021 11:18

Rapporter til Admin
Downloadthemall er ikke blevet opdateret siden 2019, så tvivler på at det er der problemet ligger. Hvad er problemet præcist? Ud fra hvad du skriver, lyder det til at virke fint? also, har du prøvet en anden browser?
--
Sidst redigeret 24-03-2021 11:19
#2
peterlravn
Ultrabruger
24-03-2021 12:19

Rapporter til Admin
Man burde hurtigt kunne lave et Python script, som går igennem alle billede-links og downloader dem. Hvor mange billeder drejer det sig om? Edit: Kan se man skal logge ind, for at komme på MitGuld.ABC.dk. Så bliver det nok noget sværere at hjælpe med
--
Sidst redigeret 24-03-2021 12:21
#3
TLW
Junior Supporter
24-03-2021 16:34

Rapporter til Admin
#1 Ja. Både Firefox og Chrome. Problemet er, at billederne, når de bliver hentet, kun er på 20KB og meget små når man åbner dem lokalt. Åbner jeg dem på siden og vælger download, så fylder de ca. 500kb og er i meget bedre opløsning. #2 Den finder omkring 3200 billeder, men en del af dem er fra selve websiden. Jeg logger ind med NemID.
--
He who runs today. Lives to run another day! - Red Dwarf
#4
butji
Semibruger
24-03-2021 16:54

Rapporter til Admin
Det lyder som om at den downloader thumbnailet i stedet for den fulde version. Mit råd ville være at kigge på urlen for en thumbnail (20kb) og urlen for det fulde billede (500kb) og se om det er til at komme frem til urlen for det fulde billede fra urlen til thumbnailet. Search and replace så det bliver de fulde billeders urls, smid dem op på en side (fx. lav en html fil med alle links og åbn den i din browser), og så brug downloadthemall på den side.
--
#5
TLW
Junior Supporter
24-03-2021 19:52

Rapporter til Admin
#4 Ja. Den henter ikke det fulde billede. Linket til et af billederne ser sådan ud: https://boerneintra.ABC.dk[...] Men hvordan vil du gætte de tal som hvert billede får?
--
He who runs today. Lives to run another day! - Red Dwarf
#6
Thomas
Gæst
24-03-2021 22:59

Rapporter til Admin
Du kan evt. forsøger med en downloadmanager, som jDownloader, som ganske simpelt crawler hele hjemmesiden for filer, der kan downloades. Du skal dog huske, at du kun må downloade billeder du rent faktisk har rettigheder til. Det er ret strenge regler på området, og afhængig af kommunen kan der blive holdt ret godt øje med det.
--
Gæstebruger, opret dit eget login og få din egen signatur.
#7
TLW
Junior Supporter
25-03-2021 08:09

Rapporter til Admin
#6 Tak. Jeg får lige testet det. Det er billeder fra børnehaven af mit eget barn og de ligger bag login, så jeg har ret til at hente dem. Det tager bare lang tid at åbne alle billeder og gemme dem. Derfor søger jeg efter et easy fix :)
--
He who runs today. Lives to run another day! - Red Dwarf
#8
TLW
Junior Supporter
25-03-2021 09:39

Rapporter til Admin
jDownloader var desværre ikke en løsning :( Vi har også kontaktet firmaet bag (Assemble) og de kunne ikke hjælpe. Jeg håber bare, at der er en anden løsning end at åbne alle billeder og gemme dem.
--
He who runs today. Lives to run another day! - Red Dwarf
#9
peterlravn
Ultrabruger
25-03-2021 10:38

Rapporter til Admin
Følgende Python-kode virker til at downloade all billeder fra en hjemmeside: https://www.codepile.net[...] Men jeg ved ikke, om den virker, når man nu skal logge ind med Nem-id? (Alt det kræver er Python installeret og kørt følgende kode i prompten "pip3 install requests bs4 tqdm")
--
#10
TLW
Junior Supporter
25-03-2021 13:11

Rapporter til Admin
#9. Tak for forslaget. Jeg må nok have lidt mere hjælp. Jeg har hentet Python og kørt det som administrator. Jeg får denne fejl når jeg sætter det sidste ind: Python 3.9.2 (tags/v3.9.2:1a79785, Feb 19 2021, 13:44:55) [MSC v.1928 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> "pip3 install requests bs4 tqdm" 'pip3 install requests bs4 tqdm' >>> pip3 install requests bs4 tqdm File "<stdin>", line 1 pip3 install requests bs4 tqdm ^ SyntaxError: invalid syntax >>> pip3 install requests bs4 tqdm) File "<stdin>", line 1 pip3 install requests bs4 tqdm)
--
He who runs today. Lives to run another day! - Red Dwarf
#11
Mazer
Monsterbruger
25-03-2021 13:22

Rapporter til Admin
#0 Få børnehaven til at ligge en .zip fil ud istedet så det kan hentes nemt af forældrene. Du kommer aldrig til at lykkes med ovenstående py kode.
--
#12
spacefractal
Megabruger
25-03-2021 13:27

Rapporter til Admin
Det skal ikke undre mig at hjemmesiden har siden tilføjet noget Kode på html eller på server side for at beskytte imod masse downloads, da dette kan æde meget trafik. Det er ret nemt at blockere dem. Skam der ikke er en nem måde når der er mange billeder, især når det handler om private billeder, og de ikke ligger noget der ligner DropBox. Så det er nok bedst at spørge personalet bag børnehaven.
--
Sidst redigeret 25-03-2021 13:28
#13
butji
Semibruger
25-03-2021 13:45

Rapporter til Admin
jeg ville gætte på at: ...FrontEnd.aspx?id=1285739&width=760 Er det fulde billede, og de små så vil være ...FrontEnd.aspx?id=1285739&width=XX hvor XX < 760. Hvis du kan hente de små billeder, kan du også komme frem til deres URL. Og så search and replace XX med 760, eller hvor høj opløsning du ønsker. Du kan også prøve at fjerne "&width=YY" og se hvad format det billede er, altså for tilsvarende url: ...FrontEnd.aspx?id=1285739 Sidst vil jeg anbefale dig at følge de andres råd og høre børnehaven ad om du ikke kan få dem på et thumbdrive, eller sendt over email.
--
#14
TLW
Junior Supporter
25-03-2021 15:10

Rapporter til Admin
#11 og #12. Børnehaven kan ikke hjælpe og firmaet bag nembørn ønsker heller ikke at hjælpe. Måske pga. nembørn skal erstattes af Aula :/ #13. De tal efter id= er billedets ID. Det ændre sig pr. billede og det gør det svært at gætte algoritmen bag. Der er ikke nogen rød tråd i de tal. Ikke så min hjerne kan afkode det i hvert fald :) Fjerner jeg det sidste, så finder den ikke noget og jeg får en fejl.
--
He who runs today. Lives to run another day! - Red Dwarf
#15
butji
Semibruger
25-03-2021 15:45

Rapporter til Admin
Yesyes, men det kan tænkes at id'et for thumbnailet er det samme som for det fulde billede, men det er det du siger ikke er tilfældet? Heldigvis har du GDPR i ryggen, siden billederne falder under personlig information, har du til enhver tid ret til at få udleveret den personlige information firmaet har om dig og dine børn, ref. art 15 pg. 3 https://gdpr-info.eu[...] Så hvis du nævner den paragraf og at du gerne vil have alle de billeder (I alle formater) de har af dig og dine børn, så burde de ret hurtigt klappe hælene sammen og makke ret.
--
#16
peterlravn
Ultrabruger
25-03-2021 16:42

Rapporter til Admin
#10 Prøv at kør: pip install requests pip install bs4 pip install tqdm Og så skal du køre den i din Command Prompt eller den Command Prompt, som kommer med den python pakke, som du har installeret Edit: Og så skal hjemmesiden og destinationen i main() selvfølgelig ændres
--
Sidst redigeret 25-03-2021 16:44
#17
TLW
Junior Supporter
25-03-2021 16:53

Rapporter til Admin
#15. Jeg er på en side https://mitguld.ABC.dk[...] og der kan jeg søge på dato osv. Der er en liste derned af med 3 billeder ved siden af hinanden også kan man ellers scrolle indtil man er død i fingeren. Trykker jeg på downloadpilen, så åbner en ny fane med f.eks. disse adresser: https://boerneintra.ABC.dk[...] https://boerneintra.ABC.dk[...] Det kunne være lækkert at trække GDPR kortet, men de har ret til at kræve penge for at udlevere det samt, at det kun er de billeder hvor mit barn kan ses forfra... som jeg husker det.
--
He who runs today. Lives to run another day! - Red Dwarf
#18
TLW
Junior Supporter
25-03-2021 16:58

Rapporter til Admin
#16. Den vil ikke en skid :( >>> pip install request File "<stdin>", line 1 pip install request ^ SyntaxError: invalid syntax Jeg har lige forsøgt at åbne en 4-5 billeder og trække dem over i en mappe direkte fra siden. De hedder alle sammen "Frontend" og vil overskrive hinanden. Vælger jeg "gem" så hedder de noget langt og kryptisk. Men bruger jeg den metode, så vil det tage hele påsken :/
--
He who runs today. Lives to run another day! - Red Dwarf
#19
Mazer
Monsterbruger
25-03-2021 17:10

Rapporter til Admin
#16 Det jo lige meget at få trådstarter til at installere python med diverse modules når koden ikke kan håndtere der han ønsker.
--
#20
spacefractal
Gigabruger
25-03-2021 20:32

Rapporter til Admin
meget tyder på det er bevidst lavet at gøre downloads besværgeligt. jeg har dog ingen ide hvordan hjemmesiden her er bygget op. så ingen ide. Det er mere kigge i kildekoden hvordan siden er bygget op. det vil dog være svært hvis der er meget javascript. Nogen gange kan det være nemmere når javascript er slået fra. men ikke altid. så burde billederne, når de først er åbnet ligge i browseren cache folder.
--
Sidst redigeret 25-03-2021 20:32
#21
TLW
Junior Supporter
30-03-2021 11:20

Rapporter til Admin
Tak for forslag fra Jer alle. Jeg tog en kande kaffe, et par gode 90'er megamix og sad 3-4 timer og fik hentet dem alle.
--
He who runs today. Lives to run another day! - Red Dwarf

Opret svar til indlægget: Hente alle billeder fra hjemmeside (DownloadThemAl...

Grundet øget spam aktivitet fra gæstebrugere, er det desværre ikke længere muligt, at oprette svar som gæst.

Hvis du ønsker at deltage i debatten, skal du oprette en brugerprofil.

Opret bruger | Login


ANNONCE