Dlaczego Python nie może parsować tych danych JSON?

Mam ten JSON w pliku:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

Napisałem ten skrypt, aby wydrukować wszystkie dane JSON:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Ten program powoduje jednak wyjątek:

Traceback (most recent call last):
  File "<pyshell#1>", line 5, in <module>
    data = json.load(f)
  File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
    obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)

Jak mogę przeanalizować JSON i wyodrębnić jego wartości?

Author: MultiplyByZer0, 2010-05-14

9 answers

Twoje dane nie są poprawne w formacie JSON . Masz [] Kiedy powinieneś mieć {}:

  • [] są dla tablic JSON, które są nazywane list w Pythonie
  • {} są dla obiektów JSON, które są nazywane dict w Pythonie

Oto jak powinien wyglądać Twój plik JSON:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

Wtedy możesz użyć swojego kodu:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Z danymi można teraz również znaleźć wartości takie jak:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

Wypróbuj je i zobacz, czy zacznie się sens.

 2156
Author: Justin Peel,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2019-03-21 21:40:19

Twoje data.json powinno wyglądać tak:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

Twój kod powinien brzmieć:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

Zauważ, że działa to tylko w Pythonie 2.6 i nowszych, ponieważ zależy to od with-oświadczenie . W Pythonie 2.5 użyj from __future__ import with_statement, w Pythonie odpowiedź Justina Peela, na której opiera się ta odpowiedź.

Możesz teraz również uzyskać dostęp do pojedynczych wartości, takich jak:

data["maps"][0]["id"]  # will return 'blabla'
data["masks"]["id"]    # will return 'valore'
data["om_points"]      # will return 'value'
 311
Author: Bengt,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-05-23 12:18:36

Odpowiedź Justina Peela jest naprawdę pomocna, ale jeśli używasz Pythona 3 czytanie JSON powinno być zrobione tak:

with open('data.json', encoding='utf-8') as data_file:
    data = json.loads(data_file.read())

Uwaga: użyj json.loads zamiast json.load. W Pythonie 3, json.loads pobiera parametr string. json.load pobiera parametr obiektu podobny do pliku. data_file.read() zwraca obiekt string.

Szczerze mówiąc, nie wydaje mi się, aby w większości przypadków ładowanie wszystkich danych json do pamięci było problemem. Widzę to w JS, Java, Kotlin, cpp, rust prawie w każdym języku, którego używam. Rozważmy problem pamięci jak joke to me:)

Z drugiej strony, nie sądzę, że możesz analizować json bez przeczytania wszystkiego.

 72
Author: Geng Jiawen,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2021-01-06 03:57:25
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))
 55
Author: smbanaei,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2013-05-12 20:47:46

"Ultra JSON" lub po prostu "ujson" poradzi sobie z posiadaniem [] w pliku JSON. Jeśli czytasz plik wejściowy JSON do programu jako listę elementów JSON; na przykład, [{[{}]}, {}, [], etc...] ujson może obsłużyć dowolną kolejność list słowników, słowników list.

Ujson można znaleźć w indeksie pakietów Pythona , A API jest prawie identyczne z wbudowaną biblioteką Pythona json.

Ujson jest również znacznie szybszy, jeśli ładujesz większe pliki JSON. Możesz zobaczyć szczegóły wydajności w porównaniu z innymi bibliotekami Pythona JSON w tym samym linku.

 13
Author: moeabdol,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-02-10 04:45:38

Jeśli używasz Python3, możesz spróbować zmienić swój (connection.json plik) JSON na:

{
  "connection1": {
    "DSN": "con1",
    "UID": "abc",
    "PWD": "1234",
    "connection_string_python":"test1"
  }
  ,
  "connection2": {
    "DSN": "con2",
    "UID": "def",
    "PWD": "1234"
  }
}

Następnie użyj następującego kodu:

connection_file = open('connection.json', 'r')
conn_string = json.load(connection_file)
conn_string['connection1']['connection_string_python'])
connection_file.close()
>>> test1
 9
Author: sushmit,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2019-04-13 09:30:18

W tym parsowaniu są dwa typy.

  1. parsowanie danych z pliku ze ścieżki systemowej
  2. parsowanie JSON ze ZDALNEGO ADRESU URL.

Z pliku możesz użyć następującego

import json
json = json.loads(open('/path/to/file.json').read())
value = json['key']
print json['value']

Ten arcticle wyjaśnia pełne parsowanie i pobieranie wartości przy użyciu dwóch scenariuszy.parsowanie JSON za pomocą Pythona

 6
Author: Bibin Wilson,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-10-05 13:47:08

Oto zmodyfikowany data.json Plik:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [{
        "id": "valore"
    }],
    "om_points": "value",
    "parameters": [{
        "id": "valore"
    }]
}

Możesz wywołać lub wydrukować dane na konsoli, używając poniższych linii:

import json
from pprint import pprint
with open('data.json') as data_file:
    data_item = json.load(data_file)
pprint(data_item)

Oczekiwany wynik dla print(data_item['parameters'][0]['id']):

{'maps': [{'id': 'blabla', 'iscategorical': '0'},
          {'id': 'blabla', 'iscategorical': '0'}],
 'masks': [{'id': 'valore'}],
 'om_points': 'value',
 'parameters': [{'id': 'valore'}]}

Oczekiwany wynik dla print(data_item['parameters'][0]['id']):

valore
 6
Author: JoboFive,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2019-04-13 09:28:00

Jako użytkownik python3 ,

Różnica między metodami load i loads jest ważna szczególnie, gdy odczytujemy dane json z pliku.

Jak podano w dokumentach:

Json.load:

Deserialize fp (a .read () - obsługa pliku tekstowego lub binarnego pliku zawierającego dokument JSON) do obiektu Pythona za pomocą tego tabela konwersji.

Json.obciążenia:

Json.ładuje: Deserialize s (a str, bytes lub bytearray instancja zawierający dokument JSON) do obiektu Pythona za pomocą tej konwersji stolik.
Json.metoda load może bezpośrednio odczytać otwarty dokument json, ponieważ jest w stanie odczytać plik binarny.
with open('./recipes.json') as data:
  all_recipes = json.load(data)

W rezultacie Twoje dane json są dostępne w formacie określonym zgodnie z tabelą konwersji:

Https://docs.python.org/3.7/library/json.html#json-to-py-table

 4
Author: muratgozel,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-11-30 09:21:20