Devices being skipped
#1
I dont have any -D option.

I have 4 gpus, its only running one of them, 3 just say skipped, I have tried running -D 1,2,3,4 and it says 4 doesnt exist even though both nvidia-smi and hashcat shows 4 devices. So I tried -D 1,2,3 and it still just runs one GPU. Whats going on here?

OpenCL API (OpenCL 1.2 CUDA 11.0.197) - Platform #1 [NVIDIA Corporation]
========================================================================
* Device #1: Tesla V100-PCIE-16GB, 15808/16160 MB (4040 MB allocatable), 80MCU
* Device #2: Tesla V100-PCIE-16GB, skipped
* Device #3: Tesla V100-PCIE-16GB, skipped
* Device #4: Tesla V100-PCIE-16GB, skipped

I have latest nvidia 450 driver on ubuntu 18

Command: ./hashcat -a 0 --session=ses -m 12700 -w 2 --remove --status --status-timer=60 -p : -O -o "out.txt" -r pantagrule.popular.rule --outfile-format=3 hash.txt pass.txt
Reply
#2
-D is for device types (2 in your case), -d is for individual devices. Try that instead.
Reply
#3
which hashcat version ? did you try with beta and release version from https://hashcat.net/beta/ and https://hashcat.net/hashcat accordingly ?

please also post the output of:
Code:
hashcat -I

minus upper-case I (letter, "I" like in Iterations)
Reply
#4
(07-25-2020, 01:43 PM)undeath Wrote: -D is for device types (1 in your case), -d is for individual devices. Try that instead.
Just tried this: ./hashcat -a 0 --session=ses -m 12700 -w 2 -d 1,2,3,4 --remove --status --status-timer=60 -p : -O -o "out.txt" -r pantagrule.popular.rule --outfile-format=3 hash.txt pass.txt

Didn't do anything, still skipping 3 gpu's. Damn, thought that would be it, thanks though.
Reply
#5
(07-25-2020, 01:46 PM)philsmd Wrote: which hashcat version ? did you try with beta and release version from https://hashcat.net/beta/ and https://hashcat.net/hashcat accordingly ?

please also post the output of:
Code:
hashcat -I

minus upper-case I (letter, "I" like in Iterations)

I compiled from the github using make install

heres the info request:

OpenCL Info:
============

OpenCL Platform ID #1
  Vendor..: NVIDIA Corporation
  Name....: NVIDIA CUDA
  Version.: OpenCL 1.2 CUDA 11.0.197

  Backend Device ID #1 (Alias: #2)
    Type...........: GPU
    Vendor.ID......: 32
    Vendor.........: NVIDIA Corporation
    Name...........: Tesla V100-PCIE-16GB
    Version........: OpenCL 1.2 CUDA
    Processor(s)...: 80
    Clock..........: 1380
    Memory.Total...: 16160 MB (limited to 4040 MB allocatable in one block)
    Memory.Free....: 15808 MB
    OpenCL.Version.: OpenCL C 1.2
    Driver.Version.: 450.51.05

  Backend Device ID #2 (Alias: #1)
    Type...........: GPU
    Vendor.ID......: 32
    Vendor.........: NVIDIA Corporation
    Name...........: Tesla V100-PCIE-16GB
    Version........: OpenCL 1.2 CUDA
    Processor(s)...: 80
    Clock..........: 1380
    Memory.Total...: 16160 MB (limited to 4040 MB allocatable in one block)
    Memory.Free....: 15808 MB
    OpenCL.Version.: OpenCL C 1.2
    Driver.Version.: 450.51.05

  Backend Device ID #3 (Alias: #1)
    Type...........: GPU
    Vendor.ID......: 32
    Vendor.........: NVIDIA Corporation
    Name...........: Tesla V100-PCIE-16GB
    Version........: OpenCL 1.2 CUDA
    Processor(s)...: 80
    Clock..........: 1380
    Memory.Total...: 16160 MB (limited to 4040 MB allocatable in one block)
    Memory.Free....: 15808 MB
    OpenCL.Version.: OpenCL C 1.2
    Driver.Version.: 450.51.05

  Backend Device ID #4 (Alias: #1)
    Type...........: GPU
    Vendor.ID......: 32
    Vendor.........: NVIDIA Corporation
    Name...........: Tesla V100-PCIE-16GB
    Version........: OpenCL 1.2 CUDA
    Processor(s)...: 80
    Clock..........: 1380
    Memory.Total...: 16160 MB (limited to 4040 MB allocatable in one block)
    Memory.Free....: 15808 MB
    OpenCL.Version.: OpenCL C 1.2
    Driver.Version.: 450.51.05



Tried both beta and stable now and no use.
Reply
#6
yeah, this really looks like a problem/bug in the alias detection code (see all other devices are detected as Alias for #1).

I will ask atom (the main hashcat developer of hashcat) if he knows how to fix it also without having access to the hardware.

Is this some cloud and/or virtualized hardware/service ? AWS ?

For completeness we probably would also need the output of
Code:
clinfo


and maybe also
Code:
lspci

thanks
Reply
#7
(07-25-2020, 02:24 PM)philsmd Wrote: yeah, this really looks like a problem/bug in the alias detection code (see all other devices are detected as Alias for #1).

I will ask atom (the main hashcat developer of hashcat) if he knows how to fix it also without having access to the hardware.

Is this some cloud and/or virtualized hardware/service ? AWS ?

For completeness we probably would also need the output of
Code:
clinfo


and maybe also
Code:
lspci

thanks

Yea its a cloud azure server

clinfo

Code:
Number of platforms                              1
  Platform Name                                  NVIDIA CUDA
  Platform Vendor                                NVIDIA Corporation
  Platform Version                                OpenCL 1.2 CUDA 11.0.197
  Platform Profile                                FULL_PROFILE
  Platform Extensions                            cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64 cl_khr_byte_addressable_store cl_khr_icd cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts cl_nv_create_buffer cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_kernel_attribute_nv
  Platform Extensions function suffix            NV

  Platform Name                                  NVIDIA CUDA
Number of devices                                4
  Device Name                                    Tesla V100-PCIE-16GB
  Device Vendor                                  NVIDIA Corporation
  Device Vendor ID                                0x10de
  Device Version                                  OpenCL 1.2 CUDA
  Driver Version                                  450.51.05
  Device OpenCL C Version                        OpenCL C 1.2
  Device Type                                    GPU
  Device Topology (NV)                            PCI-E, 00:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes
  Compiler Available                              Yes
  Linker Available                                Yes
  Max compute units                              80
  Max clock frequency                            1380MHz
  Compute Capability (NV)                        7.0
  Device Partition                                (core)
    Max number of sub-devices                    1
    Supported partition types                    None
  Max work item dimensions                        3
  Max work item sizes                            1024x1024x64
  Max work group size                            1024
  Preferred work group size multiple              32
  Warp size (NV)                                  32
  Preferred / native vector sizes
    char                                                1 / 1
    short                                                1 / 1
    int                                                  1 / 1
    long                                                1 / 1
    half                                                0 / 0        (n/a)
    float                                                1 / 1
    double                                              1 / 1        (cl_khr_fp64)
  Half-precision Floating-point support          (n/a)
  Single-precision Floating-point support        (core)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
    Correctly-rounded divide and sqrt operations  Yes
  Double-precision Floating-point support        (cl_khr_fp64)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
  Address bits                                    64, Little-Endian
  Global memory size                              16945512448 (15.78GiB)
  Error Correction support                        Yes
  Max memory allocation                          4236378112 (3.945GiB)
  Unified memory for Host and Device              No
  Integrated memory (NV)                          No
  Minimum alignment for any data type            128 bytes
  Alignment of base address                      4096 bits (512 bytes)
  Global Memory cache type                        Read/Write
  Global Memory cache size                        2621440 (2.5MiB)
  Global Memory cache line size                  128 bytes
  Image support                                  Yes
    Max number of samplers per kernel            32
    Max size for 1D images from buffer            268435456 pixels
    Max 1D or 2D image array size                2048 images
    Max 2D image size                            32768x32768 pixels
    Max 3D image size                            16384x16384x16384 pixels
    Max number of read image args                256
    Max number of write image args                32
  Local memory type                              Local
  Local memory size                              49152 (48KiB)
  Registers per block (NV)                        65536
  Max number of constant args                    9
  Max constant buffer size                        65536 (64KiB)
  Max size of kernel argument                    4352 (4.25KiB)
  Queue properties
    Out-of-order execution                        Yes
    Profiling                                    Yes
  Prefer user sync for interop                    No
  Profiling timer resolution                      1000ns
  Execution capabilities
    Run OpenCL kernels                            Yes
    Run native kernels                            No
    Kernel execution timeout (NV)                No
  Concurrent copy and kernel execution (NV)      Yes
    Number of async copy engines                  7
  printf() buffer size                            1048576 (1024KiB)
  Built-in kernels
  Device Extensions                              cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64 cl_khr_byte_addressable_store cl_khr_icd cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts cl_nv_create_buffer cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_kernel_attribute_nv

  Device Name                                    Tesla V100-PCIE-16GB
  Device Vendor                                  NVIDIA Corporation
  Device Vendor ID                                0x10de
  Device Version                                  OpenCL 1.2 CUDA
  Driver Version                                  450.51.05
  Device OpenCL C Version                        OpenCL C 1.2
  Device Type                                    GPU
  Device Topology (NV)                            PCI-E, 00:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes
  Compiler Available                              Yes
  Linker Available                                Yes
  Max compute units                              80
  Max clock frequency                            1380MHz
  Compute Capability (NV)                        7.0
  Device Partition                                (core)
    Max number of sub-devices                    1
    Supported partition types                    None
  Max work item dimensions                        3
  Max work item sizes                            1024x1024x64
  Max work group size                            1024
  Preferred work group size multiple              32
  Warp size (NV)                                  32
  Preferred / native vector sizes
    char                                                1 / 1
    short                                                1 / 1
    int                                                  1 / 1
    long                                                1 / 1
    half                                                0 / 0        (n/a)
    float                                                1 / 1
    double                                              1 / 1        (cl_khr_fp64)
  Half-precision Floating-point support          (n/a)
  Single-precision Floating-point support        (core)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
    Correctly-rounded divide and sqrt operations  Yes
  Double-precision Floating-point support        (cl_khr_fp64)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
  Address bits                                    64, Little-Endian
  Global memory size                              16945512448 (15.78GiB)
  Error Correction support                        Yes
  Max memory allocation                          4236378112 (3.945GiB)
  Unified memory for Host and Device              No
  Integrated memory (NV)                          No
  Minimum alignment for any data type            128 bytes
  Alignment of base address                      4096 bits (512 bytes)
  Global Memory cache type                        Read/Write
  Global Memory cache size                        2621440 (2.5MiB)
  Global Memory cache line size                  128 bytes
  Image support                                  Yes
    Max number of samplers per kernel            32
    Max size for 1D images from buffer            268435456 pixels
    Max 1D or 2D image array size                2048 images
    Max 2D image size                            32768x32768 pixels
    Max 3D image size                            16384x16384x16384 pixels
    Max number of read image args                256
    Max number of write image args                32
  Local memory type                              Local
  Local memory size                              49152 (48KiB)
  Registers per block (NV)                        65536
  Max number of constant args                    9
  Max constant buffer size                        65536 (64KiB)
  Max size of kernel argument                    4352 (4.25KiB)
  Queue properties
    Out-of-order execution                        Yes
    Profiling                                    Yes
  Prefer user sync for interop                    No
  Profiling timer resolution                      1000ns
  Execution capabilities
    Run OpenCL kernels                            Yes
    Run native kernels                            No
    Kernel execution timeout (NV)                No
  Concurrent copy and kernel execution (NV)      Yes
    Number of async copy engines                  7
  printf() buffer size                            1048576 (1024KiB)
  Built-in kernels
  Device Extensions                              cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64 cl_khr_byte_addressable_store cl_khr_icd cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts cl_nv_create_buffer cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_kernel_attribute_nv

  Device Name                                    Tesla V100-PCIE-16GB
  Device Vendor                                  NVIDIA Corporation
  Device Vendor ID                                0x10de
  Device Version                                  OpenCL 1.2 CUDA
  Driver Version                                  450.51.05
  Device OpenCL C Version                        OpenCL C 1.2
  Device Type                                    GPU
  Device Topology (NV)                            PCI-E, 00:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes
  Compiler Available                              Yes
  Linker Available                                Yes
  Max compute units                              80
  Max clock frequency                            1380MHz
  Compute Capability (NV)                        7.0
  Device Partition                                (core)
    Max number of sub-devices                    1
    Supported partition types                    None
  Max work item dimensions                        3
  Max work item sizes                            1024x1024x64
  Max work group size                            1024
  Preferred work group size multiple              32
  Warp size (NV)                                  32
  Preferred / native vector sizes
    char                                                1 / 1
    short                                                1 / 1
    int                                                  1 / 1
    long                                                1 / 1
    half                                                0 / 0        (n/a)
    float                                                1 / 1
    double                                              1 / 1        (cl_khr_fp64)
  Half-precision Floating-point support          (n/a)
  Single-precision Floating-point support        (core)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
    Correctly-rounded divide and sqrt operations  Yes
  Double-precision Floating-point support        (cl_khr_fp64)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
  Address bits                                    64, Little-Endian
  Global memory size                              16945512448 (15.78GiB)
  Error Correction support                        Yes
  Max memory allocation                          4236378112 (3.945GiB)
  Unified memory for Host and Device              No
  Integrated memory (NV)                          No
  Minimum alignment for any data type            128 bytes
  Alignment of base address                      4096 bits (512 bytes)
  Global Memory cache type                        Read/Write
  Global Memory cache size                        2621440 (2.5MiB)
  Global Memory cache line size                  128 bytes
  Image support                                  Yes
    Max number of samplers per kernel            32
    Max size for 1D images from buffer            268435456 pixels
    Max 1D or 2D image array size                2048 images
    Max 2D image size                            32768x32768 pixels
    Max 3D image size                            16384x16384x16384 pixels
    Max number of read image args                256
    Max number of write image args                32
  Local memory type                              Local
  Local memory size                              49152 (48KiB)
  Registers per block (NV)                        65536
  Max number of constant args                    9
  Max constant buffer size                        65536 (64KiB)
  Max size of kernel argument                    4352 (4.25KiB)
  Queue properties
    Out-of-order execution                        Yes
    Profiling                                    Yes
  Prefer user sync for interop                    No
  Profiling timer resolution                      1000ns
  Execution capabilities
    Run OpenCL kernels                            Yes
    Run native kernels                            No
    Kernel execution timeout (NV)                No
  Concurrent copy and kernel execution (NV)      Yes
    Number of async copy engines                  7
  printf() buffer size                            1048576 (1024KiB)
  Built-in kernels
  Device Extensions                              cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64 cl_khr_byte_addressable_store cl_khr_icd cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts cl_nv_create_buffer cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_kernel_attribute_nv

  Device Name                                    Tesla V100-PCIE-16GB
  Device Vendor                                  NVIDIA Corporation
  Device Vendor ID                                0x10de
  Device Version                                  OpenCL 1.2 CUDA
  Driver Version                                  450.51.05
  Device OpenCL C Version                        OpenCL C 1.2
  Device Type                                    GPU
  Device Topology (NV)                            PCI-E, 00:00.0
  Device Profile                                  FULL_PROFILE
  Device Available                                Yes
  Compiler Available                              Yes
  Linker Available                                Yes
  Max compute units                              80
  Max clock frequency                            1380MHz
  Compute Capability (NV)                        7.0
  Device Partition                                (core)
    Max number of sub-devices                    1
    Supported partition types                    None
  Max work item dimensions                        3
  Max work item sizes                            1024x1024x64
  Max work group size                            1024
  Preferred work group size multiple              32
  Warp size (NV)                                  32
  Preferred / native vector sizes
    char                                                1 / 1
    short                                                1 / 1
    int                                                  1 / 1
    long                                                1 / 1
    half                                                0 / 0        (n/a)
    float                                                1 / 1
    double                                              1 / 1        (cl_khr_fp64)
  Half-precision Floating-point support          (n/a)
  Single-precision Floating-point support        (core)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
    Correctly-rounded divide and sqrt operations  Yes
  Double-precision Floating-point support        (cl_khr_fp64)
    Denormals                                    Yes
    Infinity and NANs                            Yes
    Round to nearest                              Yes
    Round to zero                                Yes
    Round to infinity                            Yes
    IEEE754-2008 fused multiply-add              Yes
    Support is emulated in software              No
  Address bits                                    64, Little-Endian
  Global memory size                              16945512448 (15.78GiB)
  Error Correction support                        Yes
  Max memory allocation                          4236378112 (3.945GiB)
  Unified memory for Host and Device              No
  Integrated memory (NV)                          No
  Minimum alignment for any data type            128 bytes
  Alignment of base address                      4096 bits (512 bytes)
  Global Memory cache type                        Read/Write
  Global Memory cache size                        2621440 (2.5MiB)
  Global Memory cache line size                  128 bytes
  Image support                                  Yes
    Max number of samplers per kernel            32
    Max size for 1D images from buffer            268435456 pixels
    Max 1D or 2D image array size                2048 images
    Max 2D image size                            32768x32768 pixels
    Max 3D image size                            16384x16384x16384 pixels
    Max number of read image args                256
    Max number of write image args                32
  Local memory type                              Local
  Local memory size                              49152 (48KiB)
  Registers per block (NV)                        65536
  Max number of constant args                    9
  Max constant buffer size                        65536 (64KiB)
  Max size of kernel argument                    4352 (4.25KiB)
  Queue properties
    Out-of-order execution                        Yes
    Profiling                                    Yes
  Prefer user sync for interop                    No
  Profiling timer resolution                      1000ns
  Execution capabilities
    Run OpenCL kernels                            Yes
    Run native kernels                            No
    Kernel execution timeout (NV)                No
  Concurrent copy and kernel execution (NV)      Yes
    Number of async copy engines                  7
  printf() buffer size                            1048576 (1024KiB)
  Built-in kernels
  Device Extensions                              cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64 cl_khr_byte_addressable_store cl_khr_icd cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts cl_nv_create_buffer cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_kernel_attribute_nv

NULL platform behavior
  clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...)  No platform
  clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...)  No platform
  clCreateContext(NULL, ...) [default]            No platform
  clCreateContext(NULL, ...) [other]              Success [NV]
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT)  No platform
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU)  No devices found in platform
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU)  No platform
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR)  No devices found in platform
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM)  Invalid device type for platform
  clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL)  No platform

lspci

Code:
0000:00:00.0 Host bridge: Intel Corporation 440BX/ZX/DX - 82443BX/ZX/DX Host bridge (AGP disabled) (rev 03)
0000:00:07.0 ISA bridge: Intel Corporation 82371AB/EB/MB PIIX4 ISA (rev 01)
0000:00:07.1 IDE interface: Intel Corporation 82371AB/EB/MB PIIX4 IDE (rev 01)
0000:00:07.3 Bridge: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 02)
0000:00:08.0 VGA compatible controller: Microsoft Corporation Hyper-V virtual VGA
0001:00:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
0002:00:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
0003:00:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
0004:00:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
Reply
#8
Downgraded to hashcat 5.0.0 and now all devices are running.
Reply
#9
With this new change to the hashcat alias detection code all devices should be distinguished (in your particular case the PCI lanes for all devices were the same, 00:00.0, only the PCI domain 0001-0004 were different):
https://github.com/hashcat/hashcat/commi...ee7ce829d1

Could you please test with latest beta version (https://hashcat.net/beta/) and report your results in this forum thread below ?

thanks
Reply