In the name of God
This gist contains steps to setup Ubuntu 22.04
for deep learning.
podman run -dt --rm --pod new:db --name mariadb -e MYSQL_ROOT_PASSWORD=superS3cret! -e MYSQL_USER=demo -e MYSQL_DATABASE=demodb -e MYSQL_PASSWORD=password -p 3306:3306 -p 8082:8080 mariadb:10.4.4 | |
podman run -dt --rm --pod db --name adminer adminer:4.7.3-standalone | |
La propriété nature de
de Wikidata nous renseigne sur la nature de l'entité. On peut ainsi savoir combien d'associations, de services déconcentrées, de communes sont sur data.gouv.fr.
Le fichier des organisations de data.gouv ne contient pas la hiérarchie entre les organisations.
Récupérer les alias des organisations
Europe
What works:
#!/usr/bin/env python | |
import gzip | |
import os | |
import sys | |
import re | |
INPUT_DIR = "nginx-logs" | |
lineformat = re.compile(r"""(?P<ipaddress>\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}) - - \[(?P<dateandtime>\d{2}\/[a-z]{3}\/\d{4}:\d{2}:\d{2}:\d{2} (\+|\-)\d{4})\] ((\"(GET|POST) )(?P<url>.+)(http\/1\.1")) (?P<statuscode>\d{3}) (?P<bytessent>\d+) (["](?P<refferer>(\-)|(.+))["]) (["](?P<useragent>.+)["])""", re.IGNORECASE) |
# a messy hack written by Edd Dumbill. http://twitter.com/edd | |
# You may need to rerun this script if you hit a Twitter Error because you | |
# use up API rate limiting. That's why we pickle the results, so we can resume | |
# where we left off. | |
# get the twitter module using 'easy_install twitter' | |
from twitter.api import Twitter, TwitterError | |
from twitter.oauth import OAuth |