Cùng đọc bài viết với Phòng Giáo dục và Đào tạo Sa Thầy Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu mọi nơi.
NhậpXML . chức năng sẽ giúp bạn lấy dữ liệu từ website vào Google Sheets. Đây là Cách sử dụng hàm ImportXML trong Google Sheets.
Google Trang tính là một ứng dụng bảng tính miễn phí và là giải pháp thay thế tuyệt vời cho Microsoft Excel. Google Sheets cung cấp cho người dùng rất nhiều tính năng hữu ích không thua gì Excel. Ngay cả bảng tính Google Trang tính cũng có thể tự động thu thập thông tin khi bạn đang ngủ. Nó cũng có thể tải tất cả dữ liệu bạn muốn như giá cả hàng hóa, phân tích trang và hơn thế nữa ở mọi nơi.
Bạn đang xem: Cách sử dụng hàm ImportXML của Google Trang tính để thu thập dữ liệu ở mọi nơi
Nhưng nếu bạn muốn tải xuống một lượng lớn dữ liệu trên web, chẳng hạn như sao chép thông tin từ một bảng trực tuyến (danh sách sự kiện, bảng thống kê hoặc địa chỉ email nằm rải rác trên web) thì việc sao chép và dán chúng rất lãng phí thời gian và công sức phải không? phải không? Google Trang tính có một tùy chọn tốt hơn cho bạn.
Bạn có thể nhập dữ liệu từ bất kỳ trang web nào bằng một chức năng nhỏ nhưng mạnh mẽ có tên là ImportXML. Một khi thành thạo chức năng ImportXML Google Trang tínhcông việc thu thập dữ liệu hàng loạt trên web trở nên vô cùng đơn giản.
Khái niệm cơ bản về XML và HTML
Ngôn ngữ đánh dấu XML chỉ định các bộ dữ liệu trong một trang web. Về bản chất, bất kỳ tập hợp nào
arograph – đoạn văn, đôi khi có chứa cũ – chữ in đậm và có thể đường dẫn – liên kết (theo sau bởi ) .
để đóng tất cả các thẻ).
Chức năng ImportXML của Google Trang tính có thể tìm thấy một bộ dữ liệu XML nhất định và sao chép dữ liệu bên ngoài bộ dữ liệu đó. Trong ví dụ trên, nếu chúng ta muốn lấy tất cả các liên kết trên trang, chúng ta cần nhờ hàm ImportXML nhập tất cả thông tin trong thẻ. . Nếu bạn muốn toàn bộ văn bản của một trang web, bạn có thể bắt đầu bằng cách đưa mọi thứ vào hoặc mỗi phiên bản của
và sau đó xóa dữ liệu ở các giai đoạn sau.
Cách trích xuất danh sách mã bưu điện và quận trong thành phố
Các bảng trong Wikipedia là một bài tập ImportXML tuyệt vời. Bài viết sẽ lấy ví dụ tải toàn bộ mã bưu chính ở Edmonton, Alberta. Tìm danh sách mã bưu chính của Canada bắt đầu bằng chữ T. Mở trang đó trong cửa sổ trình duyệt mới để bắt đầu.
Chọn một mã bưu chính, nhấp chuột phải vào nó và chọn Quan sát để mở công cụ trình duyệt để xem mã nguồn của trang. Bạn sẽ thấy mỗi mã nguồn của trang trong một thẻ (xác định một ô của bảng). Sau đó, bài viết sẽ nhập tất cả các thẻ TD có chứa từ Edmonton trong đó.
Tạo một bảng tính Google Trang tính trống mới. Bài viết sẽ lấy toàn bộ nội dung của thẻ TD, bao gồm và liên kết bằng cách chỉ định dữ liệu bạn muốn bằng cú pháp Xpath. ImportXML lấy URL và thẻ mà bạn đang tìm kiếm làm đối số để nhập vào Google Trang tính.
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td”)
Bạn sẽ nhận được kết quả như sau:
Quay lại nguồn trang, chúng ta sẽ thấy mã bưu chính được in đậm trong thẻ tên thành phố liên kết đến các bài viết Wikipedia được đặt tại . Bây giờ hãy cố gắng chỉ lấy liên kết trong từng ô của thành phố lớn và xóa các liên kết khác (vùng lân cận). Chỉnh sửa chúng thành hai lệnh trong cột A và B:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1]”)
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/b[1]”)
Bạn cần điều chỉnh kết quả một chút:
Hành động này giúp bạn hiểu cách thức hoạt động của cú pháp truy vấn XPath: một thẻ chỉ cung cấp phiên bản đầu tiên của
Điều tuyệt vời là bạn có thể thực hiện hai truy vấn trong một chức năng. Do đó, bài viết kết hợp hai yêu cầu với một biểu tượng | giữa:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1] | //td/b[1]”)
Tuy nhiên, bạn sẽ không nhận được kết quả như trước. Nó sẽ xen kẽ toàn bộ yêu cầu hợp nhất vào một danh sách dài, thay vì hai cột. Nó có nhiều lợi ích nhưng không cần thiết trong bài viết này.
Để chọn mã bưu chính trong các hộp chứa liên kết ‘Edmonton’. Chúng tôi sẽ sử dụng mã này:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/b[1]”)
Kèm theo “tìm kiếm” – văn bản đủ điều kiện thu hẹp kết quả trong dấu ngoặc vuông mà không ảnh hưởng đến cách phân phối kết quả.
Bây giờ đến tên khu phố. Viết hàm importXML thích hợp vào cột tiếp theo, lấy văn bản sau từ “Edmonton.”
Bài viết lấy toàn bộ nội dung của span[1] và sử dụng dấu ngoặc đơn và dấu gạch chéo để phân tách nội dung, ghi “Edmonton” vào cột đầu tiên và tên vùng lân cận vào cột thứ hai. Sau đó, chúng ta có thể kết hợp mã bưu chính với tên tương ứng:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/span[1]”)
Tiếp theo, sử dụng hàm Split và nối một số cột sau đó để tách & nhóm dữ liệu đang được xử lý:
=SPLIT(nối (B2:J2),”(/)”)
Cuối cùng, đây là bảng kết quả với các thông tin cần thiết:
Cách tự động sao chép địa chỉ email từ web
Bài viết sẽ hướng dẫn bạn cách lấy tất cả email của nhân viên trên About | . trang Zapier. Nhìn vào mã nguồn, bạn sẽ thấy rằng địa chỉ email của mọi thành viên đều nằm trong trường class=”email”. Khi bạn muốn chỉ định một thuộc tính thẻ, hãy sử dụng hàm ImportXML của Google Trang tính như sau:
=importxml(“https://zapier.com/about//”, “//span[@class=”email”]”)
Cách sử dụng Regex để nhập địa chỉ Email từ web trong Google Sheets.
Để lấy địa chỉ Zapier bằng “sức mạnh” Regex, chúng ta sẽ nhập lệnh thay vì tìm kiếm lớp học. Bây giờ, chúng ta sẽ thực hiện nhiệm vụ này theo hai bước: Gọi thông tin từ trang Zapier trong cột đầu tiên, sau đó, phân loại email vào cột thứ hai:
=importxml(“https://zapier.com/about//”, “//span”)
=regextract(A1, “[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”)
Cuối cùng, chúng ta sẽ có bảng này:
Hãy nhớ rằng ImportXML sẽ tự động điền vào tất cả các cột và hàng tùy thuộc vào dữ liệu mà nó tìm thấy. Truy vấn regex phải được điền vào từng ô mà bạn muốn có kết quả. Để kết hợp tất cả lại với nhau, chỉ cần sử dụng lệnh rút lại là một công thức hằng số mảng:
=ArrayFormula(IFERROR(REGEXEXTRACT(IMPORTXML(“https://zapier.com/about//”, “//span”), “[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”))))
Và đây là kết quả:
Hy vọng bài viết hữu ích với bạn!
Đăng bởi: Phòng Giáo dục và Đào tạo Sa Thầy
Danh mục: Tổng hợp
[toggle title=”xem thêm thông tin chi tiết về Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi” state=”close”]
Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi
Hình Ảnh về: Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi
Video về: Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi
Wiki về Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi
Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi -
Cùng đọc bài viết với Phòng Giáo dục và Đào tạo Sa Thầy Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu mọi nơi.
NhậpXML . chức năng sẽ giúp bạn lấy dữ liệu từ website vào Google Sheets. Đây là Cách sử dụng hàm ImportXML trong Google Sheets.
Google Trang tính là một ứng dụng bảng tính miễn phí và là giải pháp thay thế tuyệt vời cho Microsoft Excel. Google Sheets cung cấp cho người dùng rất nhiều tính năng hữu ích không thua gì Excel. Ngay cả bảng tính Google Trang tính cũng có thể tự động thu thập thông tin khi bạn đang ngủ. Nó cũng có thể tải tất cả dữ liệu bạn muốn như giá cả hàng hóa, phân tích trang và hơn thế nữa ở mọi nơi.
Bạn đang xem: Cách sử dụng hàm ImportXML của Google Trang tính để thu thập dữ liệu ở mọi nơi
Nhưng nếu bạn muốn tải xuống một lượng lớn dữ liệu trên web, chẳng hạn như sao chép thông tin từ một bảng trực tuyến (danh sách sự kiện, bảng thống kê hoặc địa chỉ email nằm rải rác trên web) thì việc sao chép và dán chúng rất lãng phí thời gian và công sức phải không? phải không? Google Trang tính có một tùy chọn tốt hơn cho bạn.
Bạn có thể nhập dữ liệu từ bất kỳ trang web nào bằng một chức năng nhỏ nhưng mạnh mẽ có tên là ImportXML. Một khi thành thạo chức năng ImportXML Google Trang tínhcông việc thu thập dữ liệu hàng loạt trên web trở nên vô cùng đơn giản.
Khái niệm cơ bản về XML và HTML
Ngôn ngữ đánh dấu XML chỉ định các bộ dữ liệu trong một trang web. Về bản chất, bất kỳ tập hợp nào
arograph – đoạn văn, đôi khi có chứa cũ – chữ in đậm và có thể đường dẫn – liên kết (theo sau bởi ) .
để đóng tất cả các thẻ).
Chức năng ImportXML của Google Trang tính có thể tìm thấy một bộ dữ liệu XML nhất định và sao chép dữ liệu bên ngoài bộ dữ liệu đó. Trong ví dụ trên, nếu chúng ta muốn lấy tất cả các liên kết trên trang, chúng ta cần nhờ hàm ImportXML nhập tất cả thông tin trong thẻ. . Nếu bạn muốn toàn bộ văn bản của một trang web, bạn có thể bắt đầu bằng cách đưa mọi thứ vào hoặc mỗi phiên bản của
và sau đó xóa dữ liệu ở các giai đoạn sau.
Cách trích xuất danh sách mã bưu điện và quận trong thành phố
Các bảng trong Wikipedia là một bài tập ImportXML tuyệt vời. Bài viết sẽ lấy ví dụ tải toàn bộ mã bưu chính ở Edmonton, Alberta. Tìm danh sách mã bưu chính của Canada bắt đầu bằng chữ T. Mở trang đó trong cửa sổ trình duyệt mới để bắt đầu.
Chọn một mã bưu chính, nhấp chuột phải vào nó và chọn Quan sát để mở công cụ trình duyệt để xem mã nguồn của trang. Bạn sẽ thấy mỗi mã nguồn của trang trong một thẻ (xác định một ô của bảng). Sau đó, bài viết sẽ nhập tất cả các thẻ TD có chứa từ Edmonton trong đó.
Tạo một bảng tính Google Trang tính trống mới. Bài viết sẽ lấy toàn bộ nội dung của thẻ TD, bao gồm và liên kết bằng cách chỉ định dữ liệu bạn muốn bằng cú pháp Xpath. ImportXML lấy URL và thẻ mà bạn đang tìm kiếm làm đối số để nhập vào Google Trang tính.
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td”)
Bạn sẽ nhận được kết quả như sau:
Quay lại nguồn trang, chúng ta sẽ thấy mã bưu chính được in đậm trong thẻ tên thành phố liên kết đến các bài viết Wikipedia được đặt tại . Bây giờ hãy cố gắng chỉ lấy liên kết trong từng ô của thành phố lớn và xóa các liên kết khác (vùng lân cận). Chỉnh sửa chúng thành hai lệnh trong cột A và B:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1]")
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/b[1]")
Bạn cần điều chỉnh kết quả một chút:
Hành động này giúp bạn hiểu cách thức hoạt động của cú pháp truy vấn XPath: một thẻ chỉ cung cấp phiên bản đầu tiên của
Điều tuyệt vời là bạn có thể thực hiện hai truy vấn trong một chức năng. Do đó, bài viết kết hợp hai yêu cầu với một biểu tượng | giữa:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1] | //td/b[1]")
Tuy nhiên, bạn sẽ không nhận được kết quả như trước. Nó sẽ xen kẽ toàn bộ yêu cầu hợp nhất vào một danh sách dài, thay vì hai cột. Nó có nhiều lợi ích nhưng không cần thiết trong bài viết này.
Để chọn mã bưu chính trong các hộp chứa liên kết 'Edmonton'. Chúng tôi sẽ sử dụng mã này:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/b[1]")
Kèm theo "tìm kiếm" - văn bản đủ điều kiện thu hẹp kết quả trong dấu ngoặc vuông mà không ảnh hưởng đến cách phân phối kết quả.
Bây giờ đến tên khu phố. Viết hàm importXML thích hợp vào cột tiếp theo, lấy văn bản sau từ “Edmonton.”
Bài viết lấy toàn bộ nội dung của span[1] và sử dụng dấu ngoặc đơn và dấu gạch chéo để phân tách nội dung, ghi “Edmonton” vào cột đầu tiên và tên vùng lân cận vào cột thứ hai. Sau đó, chúng ta có thể kết hợp mã bưu chính với tên tương ứng:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/span[1]")
Tiếp theo, sử dụng hàm Split và nối một số cột sau đó để tách & nhóm dữ liệu đang được xử lý:
=SPLIT(nối (B2:J2),"(/)")
Cuối cùng, đây là bảng kết quả với các thông tin cần thiết:
Cách tự động sao chép địa chỉ email từ web
Bài viết sẽ hướng dẫn bạn cách lấy tất cả email của nhân viên trên About | . trang Zapier. Nhìn vào mã nguồn, bạn sẽ thấy rằng địa chỉ email của mọi thành viên đều nằm trong trường class="email". Khi bạn muốn chỉ định một thuộc tính thẻ, hãy sử dụng hàm ImportXML của Google Trang tính như sau:
=importxml(“https://zapier.com/about//”, “//span[@class=”email”]")
Cách sử dụng Regex để nhập địa chỉ Email từ web trong Google Sheets.
Để lấy địa chỉ Zapier bằng "sức mạnh" Regex, chúng ta sẽ nhập lệnh thay vì tìm kiếm lớp học. Bây giờ, chúng ta sẽ thực hiện nhiệm vụ này theo hai bước: Gọi thông tin từ trang Zapier trong cột đầu tiên, sau đó, phân loại email vào cột thứ hai:
=importxml(“https://zapier.com/about//”, “//span”)
=regextract(A1, "[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”)
Cuối cùng, chúng ta sẽ có bảng này:
Hãy nhớ rằng ImportXML sẽ tự động điền vào tất cả các cột và hàng tùy thuộc vào dữ liệu mà nó tìm thấy. Truy vấn regex phải được điền vào từng ô mà bạn muốn có kết quả. Để kết hợp tất cả lại với nhau, chỉ cần sử dụng lệnh rút lại là một công thức hằng số mảng:
=ArrayFormula(IFERROR(REGEXEXTRACT(IMPORTXML("https://zapier.com/about//", "//span"), "[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”))))
Và đây là kết quả:
Hy vọng bài viết hữu ích với bạn!
Đăng bởi: Phòng Giáo dục và Đào tạo Sa Thầy
Danh mục: Tổng hợp
[rule_{ruleNumber}]
[box type=”note” align=”” class=”” 43401″ fifu-featured=”1″ decoding=”async” alt=”NhậpXML . chức năng” class=”lazy” src=”https://vietjack.edu.vn/wp-content/uploads/2022/02/ham-importxml.jpg”>
Google Trang tính là một ứng dụng bảng tính miễn phí và là giải pháp thay thế tuyệt vời cho Microsoft Excel. Google Sheets cung cấp cho người dùng rất nhiều tính năng hữu ích không thua gì Excel. Ngay cả bảng tính Google Trang tính cũng có thể tự động thu thập thông tin khi bạn đang ngủ. Nó cũng có thể tải tất cả dữ liệu bạn muốn như giá cả hàng hóa, phân tích trang và hơn thế nữa ở mọi nơi.
Bạn đang xem: Cách sử dụng hàm ImportXML của Google Trang tính để thu thập dữ liệu ở mọi nơi
Nhưng nếu bạn muốn tải xuống một lượng lớn dữ liệu trên web, chẳng hạn như sao chép thông tin từ một bảng trực tuyến (danh sách sự kiện, bảng thống kê hoặc địa chỉ email nằm rải rác trên web) thì việc sao chép và dán chúng rất lãng phí thời gian và công sức phải không? phải không? Google Trang tính có một tùy chọn tốt hơn cho bạn.
Bạn có thể nhập dữ liệu từ bất kỳ trang web nào bằng một chức năng nhỏ nhưng mạnh mẽ có tên là ImportXML. Một khi thành thạo chức năng ImportXML Google Trang tínhcông việc thu thập dữ liệu hàng loạt trên web trở nên vô cùng đơn giản.
Khái niệm cơ bản về XML và HTML
Ngôn ngữ đánh dấu XML chỉ định các bộ dữ liệu trong một trang web. Về bản chất, bất kỳ tập hợp nào
arograph – đoạn văn, đôi khi có chứa cũ – chữ in đậm và có thể đường dẫn – liên kết (theo sau bởi ) .
để đóng tất cả các thẻ).
Chức năng ImportXML của Google Trang tính có thể tìm thấy một bộ dữ liệu XML nhất định và sao chép dữ liệu bên ngoài bộ dữ liệu đó. Trong ví dụ trên, nếu chúng ta muốn lấy tất cả các liên kết trên trang, chúng ta cần nhờ hàm ImportXML nhập tất cả thông tin trong thẻ. . Nếu bạn muốn toàn bộ văn bản của một trang web, bạn có thể bắt đầu bằng cách đưa mọi thứ vào hoặc mỗi phiên bản của
và sau đó xóa dữ liệu ở các giai đoạn sau.
Cách trích xuất danh sách mã bưu điện và quận trong thành phố
Các bảng trong Wikipedia là một bài tập ImportXML tuyệt vời. Bài viết sẽ lấy ví dụ tải toàn bộ mã bưu chính ở Edmonton, Alberta. Tìm danh sách mã bưu chính của Canada bắt đầu bằng chữ T. Mở trang đó trong cửa sổ trình duyệt mới để bắt đầu.
Chọn một mã bưu chính, nhấp chuột phải vào nó và chọn Quan sát để mở công cụ trình duyệt để xem mã nguồn của trang. Bạn sẽ thấy mỗi mã nguồn của trang trong một thẻ (xác định một ô của bảng). Sau đó, bài viết sẽ nhập tất cả các thẻ TD có chứa từ Edmonton trong đó.
Tạo một bảng tính Google Trang tính trống mới. Bài viết sẽ lấy toàn bộ nội dung của thẻ TD, bao gồm và liên kết bằng cách chỉ định dữ liệu bạn muốn bằng cú pháp Xpath. ImportXML lấy URL và thẻ mà bạn đang tìm kiếm làm đối số để nhập vào Google Trang tính.
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td”)
Bạn sẽ nhận được kết quả như sau:
Quay lại nguồn trang, chúng ta sẽ thấy mã bưu chính được in đậm trong thẻ tên thành phố liên kết đến các bài viết Wikipedia được đặt tại . Bây giờ hãy cố gắng chỉ lấy liên kết trong từng ô của thành phố lớn và xóa các liên kết khác (vùng lân cận). Chỉnh sửa chúng thành hai lệnh trong cột A và B:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1]”)
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/b[1]”)
Bạn cần điều chỉnh kết quả một chút:
Hành động này giúp bạn hiểu cách thức hoạt động của cú pháp truy vấn XPath: một thẻ chỉ cung cấp phiên bản đầu tiên của
Điều tuyệt vời là bạn có thể thực hiện hai truy vấn trong một chức năng. Do đó, bài viết kết hợp hai yêu cầu với một biểu tượng | giữa:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td/span/a[1] | //td/b[1]”)
Tuy nhiên, bạn sẽ không nhận được kết quả như trước. Nó sẽ xen kẽ toàn bộ yêu cầu hợp nhất vào một danh sách dài, thay vì hai cột. Nó có nhiều lợi ích nhưng không cần thiết trong bài viết này.
Để chọn mã bưu chính trong các hộp chứa liên kết ‘Edmonton’. Chúng tôi sẽ sử dụng mã này:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/b[1]”)
Kèm theo “tìm kiếm” – văn bản đủ điều kiện thu hẹp kết quả trong dấu ngoặc vuông mà không ảnh hưởng đến cách phân phối kết quả.
Bây giờ đến tên khu phố. Viết hàm importXML thích hợp vào cột tiếp theo, lấy văn bản sau từ “Edmonton.”
Bài viết lấy toàn bộ nội dung của span[1] và sử dụng dấu ngoặc đơn và dấu gạch chéo để phân tách nội dung, ghi “Edmonton” vào cột đầu tiên và tên vùng lân cận vào cột thứ hai. Sau đó, chúng ta có thể kết hợp mã bưu chính với tên tương ứng:
=importxml(“https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada”, “//td[span/a=”Edmonton”]/span[1]”)
Tiếp theo, sử dụng hàm Split và nối một số cột sau đó để tách & nhóm dữ liệu đang được xử lý:
=SPLIT(nối (B2:J2),”(/)”)
Cuối cùng, đây là bảng kết quả với các thông tin cần thiết:
Cách tự động sao chép địa chỉ email từ web
Bài viết sẽ hướng dẫn bạn cách lấy tất cả email của nhân viên trên About | . trang Zapier. Nhìn vào mã nguồn, bạn sẽ thấy rằng địa chỉ email của mọi thành viên đều nằm trong trường class=”email”. Khi bạn muốn chỉ định một thuộc tính thẻ, hãy sử dụng hàm ImportXML của Google Trang tính như sau:
=importxml(“https://zapier.com/about//”, “//span[@class=”email”]”)
Cách sử dụng Regex để nhập địa chỉ Email từ web trong Google Sheets.
Để lấy địa chỉ Zapier bằng “sức mạnh” Regex, chúng ta sẽ nhập lệnh thay vì tìm kiếm lớp học. Bây giờ, chúng ta sẽ thực hiện nhiệm vụ này theo hai bước: Gọi thông tin từ trang Zapier trong cột đầu tiên, sau đó, phân loại email vào cột thứ hai:
=importxml(“https://zapier.com/about//”, “//span”)
=regextract(A1, “[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”)
Cuối cùng, chúng ta sẽ có bảng này:
Hãy nhớ rằng ImportXML sẽ tự động điền vào tất cả các cột và hàng tùy thuộc vào dữ liệu mà nó tìm thấy. Truy vấn regex phải được điền vào từng ô mà bạn muốn có kết quả. Để kết hợp tất cả lại với nhau, chỉ cần sử dụng lệnh rút lại là một công thức hằng số mảng:
=ArrayFormula(IFERROR(REGEXEXTRACT(IMPORTXML(“https://zapier.com/about//”, “//span”), “[a-zA-Z0-9_.+-][email protected][a-zA-Z0-9-.]+.[a-zA-Z0-9-]{2,15}”))))
Và đây là kết quả:
Hy vọng bài viết hữu ích với bạn!
Đăng bởi: Phòng Giáo dục và Đào tạo Sa Thầy
Danh mục: Tổng hợp
[/box]
#Cách #dùng #hàm #ImportXML #của #Google #Sheets #để #thu #thập #dữ #liệu #khắp #nơi
[/toggle]
Bạn thấy bài viết Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi có giải quyết đươc vấn đề bạn tìm hiểu không?, nếu không hãy comment góp ý thêm về Cách dùng hàm ImportXML của Google Sheets để thu thập dữ liệu khắp nơi bên dưới để thpttranhungdao.edu.vn có thể chỉnh sửa & cải thiện nội dung tốt hơn cho độc giả nhé! Cám ơn bạn đã ghé thăm Website Trường THPT Trần Hưng Đạo
Chuyên mục: Văn học
#Cách #dùng #hàm #ImportXML #của #Google #Sheets #để #thu #thập #dữ #liệu #khắp #nơi
Trả lời