TSV (Giá trị phân tách bằng Tab)
TSV là định dạng dữ liệu bảng trong đó các cột được phân tách bằng ký tự tab thay vì dấu phẩy. Điều này tránh được vấn đề trích dẫn của CSV khi dữ liệu chứa dấu phẩy.
Loại MIME
text/tab-separated-values
Loại
Văn bản
Nén
Không mất dữ liệu
Ưu điểm
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
Nhược điểm
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
Khi nào nên dùng .TSV
Sử dụng TSV khi giá trị dữ liệu thường chứa dấu phẩy, hoặc trong quy trình khoa học và tin sinh học mà TSV là tiêu chuẩn.
Chi tiết kỹ thuật
Tệp TSV sử dụng ký tự tab (\t) làm dấu phân cách cột và xuống dòng làm dấu phân cách hàng. Không cần trích dẫn trừ khi giá trị chứa tab hoặc xuống dòng, vốn rất hiếm trong dữ liệu thông thường.
Lịch sử
Tệp phân tách bằng tab đã được sử dụng từ thời xử lý dữ liệu máy tính lớn đầu tiên. Định dạng này được ưa chuộng trong tin sinh học và khoa học dữ liệu nhờ tính đơn giản trong phân tích.