Developer Tools

Từ CSV sang JSON: Làm việc với dữ liệu dạng bảng trong API

Cách chuyển đổi bảng tính thành JSON cho API, lưu ý về tiêu đề cột và dấu ngoặc, đồng thời xác thực payload trước khi triển khai.

6 phút đọc

Analytics and data

CSV là định dạng mà giới kinh doanh vẫn dùng để trao đổi dữ liệu: xuất từ CRM, sao kê ngân hàng, và báo cáo tồn kho. JSON là thứ mà hầu hết các REST và serverless API mong đợi. Chuyển đổi qua lại giữa chúng một cách gọn gàng giúp tiết kiệm hàng giờ viết script thủ công.

Cấu trúc phổ biến: mảng các đối tượng

Đối với API, cấu trúc JSON thân thiện nhất là mảng các đối tượng, mỗi đối tượng tương ứng một hàng, khóa lấy từ hàng tiêu đề:

[
  { "sku": "A-100", "qty": "12", "warehouse": "East" },
  { "sku": "B-220", "qty": "3", "warehouse": "West" }
]

Lưu ý rằng CSV chứa chuỗi ký tự trừ khi bạn thêm bước chuyển đổi kiểu dữ liệu riêng. API của bạn nên ép kiểu qty thành số nếu cần.

Tiêu đề cột và tính nhất quán

  • Hàng đầu tiên phải là tên các cột; hãy đổi tên các cột trùng lặp trước khi chuyển đổi.
  • Chú ý ký tự BOM ở đầu các file UTF-8 xuất từ Excel—chúng có thể làm hỏng parser đơn giản và biến tiêu đề đầu tiên thành \uFEFFsku.
  • Trường có dấu ngoặc có thể chứa dấu phẩy và xuống dòng; parser tốt sẽ xử lý được; còn tách bằng regex theo dấu phẩy thì không.

Khi chuyển JSON → CSV

Các công cụ báo cáo và file đính kèm email thường cần CSV trở lại. Xuất một hàng cho mỗi đối tượng; dùng hợp của tất cả các khóa làm cột nếu các đối tượng khác nhau (hàng thưa sẽ có ô trống).

Xác thực trước khi đưa vào sản xuất

Sau khi chuyển đổi, hãy chạy JSON qua JSON Formatter để phát hiện dấu phẩy thừa, nháy đơn, hoặc giá trị NaN vô tình xuất hiện từ các công thức bảng tính.

Nếu pipeline của bạn cũng nhận YAML từ các config repo, YAML to JSON có thể giúp căn chỉnh mọi thứ về cùng một bộ kiểm tra JSON schema.

Thử ngay trên trình duyệt

CSV ↔ JSON Converter của chúng tôi chạy trực tiếp trên trình duyệt: dán một đoạn dữ liệu xuất mẫu, nhận JSON đã được định dạng, hoặc chuyển ngược lại để tạo báo cáo nhanh. Không có file nào rời khỏi thiết bị của bạn.

Hãy coi CSV là dữ liệu đầu vào không đáng tin nếu người dùng tải lên—giới hạn kích thước, quét lỗ hổng formula injection trong Excel (=cmd|), và tuyệt đối không thực thi nội dung ô như mã lệnh.

Tóm tắt

  • Ưu tiên cấu trúc tiêu đề + hàng → mảng các đối tượng cho API.
  • Tuân thủ quy tắc dấu ngoặc; tránh tự viết CSV parser thủ công cho môi trường sản xuất.
  • Luôn xác thực JSON và schema trước khi gửi đến các dịch vụ phía sau.